德州儀器(TI)11月21日在北京媒體溝通會上宣布,該公司于11月14~18日美國西雅圖舉辦的2011年全球超級計算大會(SC11) 上,推出了TMS320C6678多核DSP,并演示了其高性能計算(HPC)應用。
C6678有8個1.25GHz DSP內核,可在10W功耗下實現160GFLOP的“超高”計算性能。德州儀器中國區通用DSP業務發展經理鄭小龍指出:“C6678的性能是任何已推出多核DSP的5倍。”他還透露,2012年將推出樣片的TMS320TCI6609多內核DSP的性能可達到C6678多核DSP的4倍,在32W功耗下實現512GFLOP的性能。”
TMS320C6678與TMS320TCI6609均基于TI的Keystone多核架構(見圖1),采用了可自動調整內核電壓的專有SmartReflex技術,因此具有單位MHz/GMAC/GFLOP的最低功耗。除上述特性外,還有眾多高速I/O接口,8MB的L2閃存,8GB的L3閃存,及12.8GB/s的存儲器帶寬。
圖1 TI的Keystone多核架構
這兩款多核DSP適合油氣勘探、金融建模及分子動力學等需要超高性能、低功耗以及簡單可編程的計算應用。據了解,TI與德州大學奧斯汀分校合作,將該校科學計算高密度線性代數庫(libflame庫)移植到了C6678多核DSP中。該移植可帶來所有libflame功能,為上述應用提供基本軟件組塊。
另外,鄭小龍表示,研華(Advantech)已采用4個TMS320C6678多核DSP開發出DSPC-8681多媒體處理引擎(MPE),該款半長PCIe卡可在50 W功耗下實現500GFLOP以上的性能(見圖2)。另外,正在開發的全長DSPC-8681PCIe卡將采用8個C6678多核DSP,可實現1萬億次浮點運算,或采用4個TCI6609多核DSP,實現2萬億次浮點運算。這兩種情況下的功耗約為200W。(記者 恩平)
圖2 TMS320C6678多核DSP與DSPC-8681半長PCIe卡的主要特性