
Unit Pemprosesan Neural (NPU) ialah pemproses khusus yang direka untuk mengendalikan tugas kecerdasan buatan dengan lebih cekap daripada pemproses tujuan umum.Peranan utamanya ialah untuk mempercepatkan operasi rangkaian saraf yang digunakan dalam ciri seperti pengecaman imej, pemprosesan suara, pengesanan objek dan inferens AI masa nyata.Tidak seperti CPU, yang dibina untuk mengurus banyak tugas pengkomputeran yang berbeza, NPU memfokuskan pada pengiraan berkaitan AI.Ia dioptimumkan untuk memproses sejumlah besar data pada masa yang sama, menjadikannya sesuai untuk beban kerja yang memerlukan pengecaman corak pantas dan membuat keputusan.Dalam peranti moden, NPU membantu ciri AI berjalan terus pada perkakasan tempatan dan bukannya bergantung sepenuhnya pada pelayan awan.Ini membolehkan telefon pintar, kamera pintar, robot, kenderaan dan peranti tepi bertindak balas dengan lebih pantas sambil menggunakan kurang kuasa.Oleh sebab itu, NPU telah menjadi bahagian penting dalam sistem pintar moden.
NPU dibina daripada beberapa modul perkakasan khusus yang berfungsi bersama untuk memproses beban kerja rangkaian saraf dengan cepat dan cekap.Daripada menghantar setiap operasi melalui satu pemproses tujuan umum, beban kerja dibahagikan merentasi blok perkakasan khusus yang memproses data secara selari secara berterusan.Struktur ini meningkatkan kelajuan inferens AI, mengurangkan pergerakan data yang tidak perlu, mengurangkan penggunaan kuasa dan membantu mengekalkan penggunaan memori yang cekap.
Semasa pemprosesan AI, data mengalir melalui pelbagai peringkat di dalam pemproses.Data input mula-mula memasuki saluran pengkomputeran, di mana operasi matematik berskala besar dilaksanakan.Hasil perantaraan kemudian bergerak melalui pemprosesan pengaktifan, pecutan tensor, operasi berkaitan imej dan perkakasan pengoptimuman memori sebelum output akhir dihasilkan.Oleh kerana modul ini beroperasi bersama dalam urutan yang diselaraskan, NPU boleh mengekalkan daya pemprosesan yang tinggi walaupun semasa menjalankan model rangkaian saraf yang besar.
Enjin pengkomputeran utama di dalam NPU ialah unit Multiply-Accumulate (MAC).Kebanyakan beban kerja rangkaian saraf berulang kali melakukan pendaraban dan penambahan merentas set data yang sangat besar, jadi perkakasan ini mengendalikan sebahagian besar pengiraan AI semasa inferens.Apabila data input memasuki rangkaian saraf, nilai didarab dengan nilai berat yang disimpan dan kemudian ditambah bersama untuk menjana output baharu.Proses ini berulang secara berterusan merentasi banyak lapisan rangkaian saraf.
NPU moden selalunya mengandungi ratusan atau ribuan unit MAC yang beroperasi secara serentak.Daripada mengira satu operasi pada satu masa, perkakasan mengedarkan beban kerja merentasi banyak laluan pelaksanaan selari.Kumpulan besar data AI bergerak melalui pemproses bersama-sama, meningkatkan kelajuan inferens dengan sangat baik sambil mengekalkan kependaman rendah.Dalam sistem pengecaman imej, contohnya, unit MAC berulang kali mengimbas kumpulan piksel dan menggabungkan nilai penapis untuk mengesan tepi, tekstur, bentuk dan corak.Dalam model bahasa, perkakasan yang sama melakukan operasi vektor dan matriks berskala besar untuk memproses token dan perhubungan antara perkataan.
Selepas pengiraan matematik ini selesai, hasilnya beralih ke modul Fungsi Pengaktifan.Rangkaian saraf bergantung pada fungsi pengaktifan bukan linear untuk memproses hubungan kompleks dalam data.Tanpa pemprosesan pengaktifan, rangkaian hanya akan melakukan pengiraan linear yang mudah dan tidak dapat mengendalikan tugas AI lanjutan dengan berkesan.
Modul ini melaksanakan fungsi seperti ReLU, Sigmoid dan Tanh secara langsung dalam perkakasan.Nilai masuk ditukar dengan cepat mengikut peraturan pengaktifan yang dipilih.ReLU, sebagai contoh, mengalih keluar nilai negatif sambil mengekalkan output positif, membantu rangkaian memfokus pada isyarat ciri yang lebih kuat semasa inferens.Memandangkan pemprosesan pengaktifan berlaku berulang kali merentas setiap lapisan rangkaian saraf, perkakasan pecutan khusus membantu mengurangkan kelewatan dan menghalang unit pengkomputeran utama daripada menjadi lebih muatan.
NPU juga termasuk perkakasan khusus untuk mengendalikan operasi tensor dan pemprosesan data spatial.Hampir setiap model AI moden bergantung pada tensor, yang merupakan struktur data berbilang dimensi yang digunakan untuk menyusun maklumat merentas dimensi seperti lebar, ketinggian, saluran, lapisan ciri dan kelompok.Sebilangan besar data tensor bergerak secara berterusan antara lapisan rangkaian saraf semasa inferens.
Unit Pecutan Tensor memproses struktur tensor ini secara langsung dalam perkakasan.Operasi seperti pendaraban tensor, pembentukan semula, transformasi dan pengumpulan dilaksanakan dengan lebih pantas berbanding pemproses tujuan umum.Pecutan khusus ini menjadi sangat penting dalam seni bina transformer, sistem penglihatan komputer, model bahasa yang besar dan aplikasi AI masa nyata yang memerlukan daya pemprosesan yang sangat tinggi.
Di samping pemprosesan tensor, NPU juga mengandungi modul yang direka untuk operasi data 2D dan spatial yang biasa digunakan dalam beban kerja imej dan video.Sistem penglihatan komputer sentiasa mengubah saiz, menyusun semula, menapis dan memindahkan sejumlah besar data piksel sebelum analisis AI yang lebih mendalam bermula.Mengendalikan tugas ini secara berasingan meningkatkan kecekapan dan mengurangkan tekanan pada enjin pengkomputeran utama.
Semasa pemprosesan imej, perkakasan menguruskan operasi seperti pensampelan turun, pergerakan peta ciri, penyalinan imej, saiz semula, pemangkasan dan pemindahan data spatial.Sebagai contoh, video beresolusi tinggi yang ditangkap oleh kamera mungkin terlebih dahulu diubah saiznya dan disusun semula sebelum memasuki saluran paip rangkaian saraf.Ini mengurangkan beban pengiraan sambil mengekalkan maklumat visual penting yang diperlukan untuk pengesanan objek dan analisis pemandangan.
Model AI moden memerlukan sejumlah besar memori untuk menyimpan berat rangkaian saraf, tensor dan data perantaraan.Memindahkan maklumat ini secara berterusan antara memori dan perkakasan pengkomputeran meningkatkan penggunaan lebar jalur, kependaman dan penggunaan kuasa.Untuk mengurangkan overhed ini, NPU menyertakan modul Pemampatan Data dan Penyahmampatan khusus.
Sebelum data disimpan dalam ingatan, corak berulang dan nilai berat dimampatkan ke dalam format yang lebih kecil.Semasa pelaksanaan, maklumat yang dimampatkan dipulihkan dengan cepat dan dihantar terus ke saluran paip pengkomputeran.Ini mengurangkan trafik memori dan membolehkan lebih banyak data AI kekal di dalam memori tempatan berkelajuan tinggi lebih dekat dengan pemproses.
Kaedah mampatan lanjutan selalunya boleh mengurangkan saiz model beberapa kali sambil mengekalkan ketepatan inferens yang hampir sama.Ini menjadi sangat penting dalam telefon pintar, sistem terbenam, kamera pintar, elektronik boleh pakai dan peranti AI kelebihan lain yang kapasiti memori dan kecekapan kuasa adalah terhad.

Prestasi NPU tidak bergantung pada satu blok perkakasan.Kecekapannya datang daripada cara semua modul pemprosesan beroperasi bersama sebagai saluran paip yang diselaraskan.
Beban kerja AI biasa bermula dengan pengiraan matematik berskala besar di dalam unit MAC.Hasil perantaraan kemudiannya melalui pemprosesan pengaktifan untuk memperkenalkan tingkah laku tak linear ke dalam rangkaian saraf.Perkakasan pecutan tensor secara berterusan mengatur dan memproses data berbilang dimensi sepanjang saluran paip, manakala modul pemprosesan spatial mengurus operasi berkaitan imej dan video.Pada masa yang sama, perkakasan mampatan mengurangkan overhed pemindahan memori di latar belakang.
Oleh kerana operasi ini berjalan serentak merentasi laluan perkakasan khusus, NPU boleh memproses beban kerja AI yang besar dengan daya pemprosesan yang tinggi, kependaman yang lebih rendah dan kecekapan kuasa yang jauh lebih baik daripada pemproses tradisional.
Telefon pintar moden mengendalikan sejumlah besar operasi setiap saat.Telefon boleh membuka kunci dengan pengecaman muka, membuka kamera, memproses foto, menterjemah pertuturan dan menjalankan aplikasi berbantukan AI hampir serta-merta.Untuk menyokong tahap prestasi ini dalam peranti mudah alih nipis dengan kapasiti bateri terhad, telefon pintar bergantung pada seni bina Sistem-pada-Cip (SoC) yang sangat bersepadu.
Di dalam SoC, berbilang pemproses berfungsi bersama, dan setiap pemproses dioptimumkan untuk beban kerja yang berbeza.CPU menguruskan kawalan sistem, aplikasi dan tugas pengkomputeran am.GPU mengendalikan pemaparan grafik, permainan dan pemprosesan visual.NPU (Unit Pemprosesan Neural) memfokuskan secara khusus pada pengiraan AI.
Daripada menghalakan beban kerja rangkaian saraf melalui CPU atau GPU, telefon pintar mengarahkan banyak tugas AI ke NPU, di mana perkakasan dioptimumkan untuk pemprosesan AI selari pantas.Pemisahan ini meningkatkan kecekapan kerana setiap pemproses mengendalikan jenis beban kerja yang direka bentuk untuknya.Akibatnya, telefon pintar boleh melakukan operasi AI lanjutan dengan masa tindak balas yang lebih pantas, kependaman yang lebih rendah dan kecekapan kuasa yang lebih baik.
Sebelum NPU mudah alih menjadi biasa, banyak ciri AI telefon pintar sangat bergantung pada pengkomputeran awan.Tugas seperti pengecaman suara, terjemahan bahasa, peningkatan imej dan pembantu pintar selalunya memerlukan data untuk dimuat naik ke pelayan jauh untuk diproses sebelum hasil dikembalikan ke peranti.Ini menyebabkan kelewatan, meningkatkan trafik rangkaian dan menimbulkan kebimbangan privasi.
Pengenalan NPU mudah alih khusus telah mengubah aliran kerja ini dengan ketara.Model AI kini boleh berjalan terus pada telefon pintar itu sendiri, membolehkan banyak operasi dilaksanakan secara tempatan dalam masa nyata dan bukannya bergantung sepenuhnya pada pelayan luaran.
Peralihan ini memberikan beberapa kelebihan utama:
• Kependaman yang lebih rendah kerana data tidak lagi memerlukan komunikasi awan yang berterusan
• Masa tindak balas AI yang lebih pantas semasa operasi masa nyata
• Perlindungan privasi yang lebih baik kerana data sensitif boleh kekal pada peranti
• Penggunaan kuasa yang lebih rendah melalui perkakasan yang dioptimumkan khusus untuk beban kerja AI
• Prestasi AI yang lebih stabil walaupun dengan sambungan internet yang lemah atau tidak tersedia
Apabila NPU mudah alih menjadi lebih berkuasa, telefon pintar mula menjalankan ciri AI lanjutan secara berterusan di latar belakang tanpa kelewatan yang ketara semasa penggunaan harian.
Salah satu penggunaan NPU mudah alih yang paling ketara ialah fotografi AI.Kamera telefon pintar moden tidak lagi bergantung hanya pada penderia imej dan algoritma pemprosesan imej tradisional.Model AI kini menganalisis data imej secara berterusan semasa kamera beroperasi.
Apabila apl kamera dibuka, telefon pintar mula memproses dengan serta-merta strim imej masuk bingkai demi bingkai.NPU menganalisis keadaan pencahayaan, sempadan objek, butiran muka, warna, tekstur dan corak pergerakan dalam masa nyata.Berdasarkan analisis ini, sistem melaraskan pendedahan, imbangan putih, tetapan HDR, ketajaman dan kontras hampir serta-merta sebelum imej ditangkap.
Dalam fotografi cahaya malap, NPU menggabungkan berbilang bingkai imej bersama-sama untuk meningkatkan kecerahan sambil mengurangkan hingar visual.Semasa fotografi potret, pemproses memisahkan subjek latar depan daripada kawasan latar belakang dan menggunakan kesan kedalaman dengan lebih tepat di sekeliling tepi seperti rambut, cermin mata dan kontur pakaian.
Pengecaman pemandangan juga sangat bergantung pada NPU.Pemproses membandingkan corak imej dengan model AI terlatih untuk mengenal pasti persekitaran seperti makanan, landskap, haiwan peliharaan, dokumen, matahari terbenam atau pemandangan malam.Setelah dikenali, kamera melaraskan tetapan secara automatik untuk mengoptimumkan kualiti imej.
Oleh kerana pengiraan ini berlaku terus pada telefon pintar, fotografi AI terasa hampir serta-merta walaupun sejumlah besar pengiraan rangkaian saraf berlaku secara berterusan di latar belakang.
Pembantu suara dan ciri berkaitan pertuturan juga sangat bergantung pada pecutan AI tempatan.Apabila pengguna bercakap dengan telefon pintar, mikrofon menangkap isyarat audio mentah yang mesti dibersihkan, diasingkan dan ditukar kepada corak pertuturan yang boleh dikenali.
NPU secara berterusan memproses strim audio dengan mengenal pasti fonem, menapis hingar latar belakang dan memadankan corak bunyi dengan model pengecaman pertuturan.Pemprosesan AI tempatan membolehkan perkataan bangun dan arahan suara biasa dikesan hampir serta-merta tanpa sentiasa menghantar rakaman audio ke pelayan awan.
Ini meningkatkan tindak balas untuk tugas seperti:
• Arahan suara
• Transkripsi pertuturan masa nyata
• Terjemahan bahasa
• Interaksi pembantu AI
• Peningkatan panggilan AI
• Penindasan hingar semasa panggilan video
Oleh kerana kebanyakan pemprosesan berlaku secara langsung pada peranti, interaksi suara kekal lebih lancar walaupun dalam keadaan rangkaian yang tidak stabil.
Telefon pintar moden juga menggunakan NPU untuk pengoptimuman permainan dan pengurusan sistem pintar.Semasa permainan, model AI memantau permintaan pemaparan bingkai, gelagat beban kerja, keadaan terma, corak input sentuhan dan penggunaan bateri dalam masa nyata.
Sistem ini boleh melaraskan beban kerja GPU secara dinamik, mengoptimumkan peruntukan kuasa, menstabilkan kadar bingkai dan mengurangkan terlalu panas semasa sesi permainan yang panjang.Sesetengah telefon pintar juga menggunakan teknik peningkatan AI dan ramalan gerakan untuk meningkatkan kelancaran visual sambil mengekalkan penggunaan kuasa yang lebih rendah.
Di luar permainan, NPU membantu mengoptimumkan aplikasi latar belakang, pengurusan bateri, interaksi uer ramalan dan penjadualan tugas berdasarkan corak penggunaan peranti.
Pembangunan NPU mudah alih dipercepatkan dengan pantas apabila beban kerja AI telefon pintar menjadi lebih maju dan memerlukan pengiraan.
|
Tempoh |
Pembangunan NPU Mudah Alih |
|
2017 — NPU Mudah Alih Komersial Awal |
Huawei memperkenalkan salah satu telefon pintar komersial pertama
NPU melalui pemproses Kirin 970.Ini menandakan peralihan besar ke arah
pecutan AI pada peranti berskala besar di dalam telefon pintar pengguna.Sebaliknya
bergantung terutamanya pada CPU dan GPU untuk tugas AI, telefon pintar kini disertakan
perkakasan AI khusus secara langsung di dalam seni bina SoC. |
|
2018 — Pengembangan AI Pada Peranti |
Apple memperkenalkan Enjin Neural di dalam A12 Bionic
cip, meningkatkan pemprosesan AI untuk pengecaman muka, pengiraan
fotografi, dan ciri mudah alih pintar.AI pada peranti menjadi yang utama
fokus dalam pembangunan telefon pintar perdana. |
|
2019–2020 — Integrasi AI Seluruh Industri |
Pengeluar cip utama termasuk Qualcomm, Samsung dan
MediaTek mula menyepadukan pemecut AI khusus ke dalam mudah alih perdana
pemproses.Prestasi AI mula menjadi faktor persaingan utama dalam
reka bentuk perkakasan telefon pintar. |
|
2021–2023 — Pemprosesan AI Menjadi Penanda Aras Teras |
Pengeluar telefon pintar semakin membandingkan NPU
prestasi bersama prestasi CPU dan GPU.NPU menjadi pusat kepada
fotografi pengiraan, AI suara, peningkatan video, pengoptimuman bateri,
dan ciri sistem pintar. |
|
2024–2025 — Model AI Besar Dijalankan pada Telefon Pintar |
NPU mudah alih moden memperoleh kuasa pemprosesan yang mencukupi untuk
menyokong model AI yang lebih besar secara langsung pada telefon pintar dan peranti tepi.Lebih banyak AI
beban kerja kini boleh dijalankan secara tempatan tanpa bergantung pada awan
infrastruktur, menambah baik tindak balas dan privasi. |
Pemproses telefon pintar utama moden kini termasuk seni bina NPU yang sangat canggih yang dioptimumkan untuk inferens AI masa nyata, daya pemprosesan tinggi dan kecekapan tenaga yang dipertingkatkan.
|
Pemproses Mudah Alih |
Ciri NPU |
|
Apple A17 Pro |
Termasuk Enjin Neural 26-teras yang direka untuk pantas
pemprosesan AI pada peranti.Seni bina meningkatkan fotografi AI, suara
pengecaman, dan ciri sistem pintar masa nyata merentas peranti Apple. |
|
Qualcomm Snapdragon 8 Gen 3 |
Menggunakan pemproses AI Heksagon ditingkatkan yang dioptimumkan
AI generatif, pecutan rangkaian saraf, pemprosesan imej lanjutan, dan
beban kerja AI mudah alih yang cekap. |
|
MediaTek Dimensity 9300 |
Termasuk APU generasi keenam (Unit Pemprosesan AI) dengan
peningkatan besar dalam kelajuan inferens AI dan pemprosesan AI masa nyata
keupayaan untuk telefon pintar dan peranti tepi. |
|
Samsung Exynos 2400 |
Mempunyai NPU mudah alih generasi seterusnya yang memfokuskan pada lebih pantas
pemprosesan AI pada peranti untuk fotografi pengiraan, sistem pintar
operasi, dan aplikasi AI mudah alih termaju. |

Kedua-dua GPU dan NPU direka untuk memproses sejumlah besar data secara selari, tetapi ia dibina untuk tujuan yang sangat berbeza.GPU pada asalnya dibangunkan untuk pemaparan grafik, manakala NPU dicipta khusus untuk pengiraan rangkaian saraf dan inferens AI. Disebabkan perbezaan matlamat reka bentuk ini, kedua-dua pemproses mengendalikan beban kerja AI dengan cara yang sangat berbeza.GPU boleh menjalankan model AI dengan berkesan, terutamanya dalam sistem latihan berskala besar, tetapi ia masih membawa banyak kerumitan pemproses grafik.NPU memudahkan kebanyakan operasi ini dengan memfokuskan hampir sepenuhnya pada pengiraan berkaitan AI.
|
Ciri |
CPU
(Unit Pemprosesan Pusat) |
GPU
(Unit Pemprosesan Grafik) |
NPU
(Unit Pemprosesan Neural) |
|
Tujuan Utama |
Tujuan am
pengkomputeran dan kawalan sistem |
selari
grafik dan pengiraan berprestasi tinggi |
inferens AI dan
pecutan rangkaian saraf |
|
Beban Kerja Utama |
Beroperasi
sistem, aplikasi, multitasking |
Grafik
rendering, latihan AI, pengkomputeran saintifik |
pemprosesan AI,
operasi tensor, inferens pembelajaran mendalam |
|
Gaya Pemprosesan |
Berurutan
pemprosesan |
Selari besar-besaran
pemprosesan |
dioptimumkan AI
pemprosesan selari |
|
Reka Bentuk Teras |
Sedikit berkuasa dan
teras fleksibel |
beribu-ribu
teras pelaksanaan selari |
AI khusus
unit pecutan |
|
Prestasi AI |
Sederhana |
tinggi |
Sangat Tinggi untuk AI
inferens |
|
Matriks
Kelajuan Pendaraban |
Terhad |
Cepat |
Sangat dioptimumkan |
|
Tensor
Memproses |
berasaskan perisian |
Disokong
melalui pecutan GPU |
Tensor khusus
perkakasan pecutan |
|
Kecekapan Kuasa |
Lebih rendah untuk AI
beban kerja |
Sederhana hingga tinggi
penggunaan kuasa |
Berkuasa tinggi
cekap |
|
Penjanaan Haba |
Sederhana |
Tinggi di bawah berat
beban kerja |
Lebih rendah semasa AI
inferens |
|
Lebar Jalur Memori
Penggunaan |
Sederhana |
Sangat tinggi |
Dioptimumkan dan
dikurangkan |
|
Latensi dalam AI
Tugasan |
Lebih tinggi |
Sederhana |
Sangat rendah |
|
AI Masa Nyata
Keupayaan |
Terhad |
bagus |
Cemerlang |
|
Terbaik untuk AI
Latihan |
Tidak ideal |
Cemerlang |
Terhad berbanding
kepada GPU |
|
Terbaik untuk AI
Inferens |
Beban kerja asas |
Berprestasi tinggi
inferens |
Dioptimumkan
inferens masa nyata |
|
Biasa
Aplikasi |
PC, pelayan,
sistem pengendalian |
Permainan, AI
latihan, rendering, simulasi |
telefon pintar,
AI tepi, robotik, kamera pintar |
|
Kebergantungan kepada
AI awan |
Lebih tinggi |
Sederhana |
Lebih rendah kerana
pecutan AI tempatan |
|
Bateri
Kecekapan dalam Peranti Mudah Alih |
Lebih rendah |
Sederhana |
tinggi |
|
Peranti Biasa |
komputer,
komputer riba, pelayan |
PC permainan, AI
pelayan, stesen kerja |
Telefon pintar, IoT
peranti, perkakasan AI tepi |
|
Kos dan
Kerumitan |
Tujuan am
seni bina |
Kompleks
seni bina berprestasi tinggi |
khusus
Seni bina berfokuskan AI |
|
Kelebihan Utama |
Fleksibiliti dan
pengurusan sistem |
Berskala besar
pengiraan selari |
Cepat dan
pemprosesan AI tempatan yang cekap |
Selain NPU, sistem pengkomputeran moden menggunakan pelbagai jenis pemproses kerana tiada seni bina tunggal boleh mengendalikan setiap beban kerja dengan cekap.Sesetengah pemproses menumpukan pada kawalan sistem, sesetengahnya pakar dalam pemaparan grafik, manakala yang lain dioptimumkan untuk pecutan AI, rangkaian, pengkomputeran saintifik atau kawalan terbenam.
Di dalam telefon pintar moden, pelayan, sistem perindustrian, platform robotik, kenderaan dan peranti AI tepi, berbilang unit pemprosesan sering berfungsi bersama secara serentak.Setiap pemproses mengendalikan jenis beban kerja yang direka khusus untuknya, meningkatkan prestasi, kecekapan kuasa dan responsif masa nyata merentas persekitaran pengkomputeran moden.
CPU (Unit Pemprosesan Pusat) ialah pengawal utama kebanyakan sistem pengkomputeran.Ia menguruskan sistem pengendalian, aplikasi, penyelarasan memori, penjadualan tugas dan komunikasi antara komponen perkakasan.
CPU sangat fleksibel dan boleh mengendalikan banyak beban kerja yang berbeza dengan pasti, menjadikannya penting dalam komputer, telefon pintar, pelayan dan sistem terbenam.Walau bagaimanapun, mereka kurang cekap untuk beban kerja AI selari berskala besar berbanding pemproses yang lebih khusus.
GPU (Unit Pemprosesan Grafik) dioptimumkan untuk pemprosesan selari berskala besar.Seni bina mengandungi banyak teras pelaksanaan yang mampu mengendalikan beribu-ribu operasi secara serentak.
GPU pada asalnya dibangunkan untuk pemaparan grafik, tetapi kini digunakan secara meluas untuk latihan AI, simulasi saintifik, pemprosesan video dan pengkomputeran berprestasi tinggi kerana keupayaan pengiraan selari yang kukuh.
TPU (Unit Pemprosesan Tensor) dioptimumkan untuk beban kerja AI berasaskan tensor dan pecutan pembelajaran mendalam berskala besar.Pemproses ini direka bentuk terutamanya untuk infrastruktur AI awan dan persekitaran pembelajaran mesin pusat data.
TPU sangat berkesan untuk:
• Latihan pembelajaran mendalam
• Model AI yang besar
• Pengiraan tensor
• Perkhidmatan Cloud AI
• Pecutan AI pemprosesan tinggi
FPGA (Field-Programmable Gate Array) menggunakan blok logik boleh atur cara yang boleh dikonfigurasikan untuk tugas tertentu selepas pembuatan.Tidak seperti seni bina pemproses tetap, FPGA membenarkan fungsi perkakasan itu sendiri disesuaikan.
FPGA digunakan secara meluas dalam:
• Sistem komunikasi
• Elektronik automotif
• Automasi industri
• Sistem aeroangkasa
• Pengkomputeran tepi
• Peranti perubatan
DPU (Unit Pemprosesan Data) dioptimumkan untuk beban kerja tertumpu data di dalam infrastruktur awan dan sistem rangkaian.DPU membantu mengurangkan beban kerja CPU dengan mempercepatkan pergerakan data, operasi storan, penyulitan dan pengurusan trafik rangkaian.
Pemproses ini biasanya digunakan dalam:
• Pusat data
• Pengkomputeran awan
• Rangkaian berkelajuan tinggi
• Pecutan storan
• Infrastruktur pelayan
VPU (Unit Pemprosesan Penglihatan) mengkhusus dalam penglihatan komputer dan pemprosesan AI berasaskan imej.VPU mempercepatkan beban kerja seperti pengecaman muka, pengesanan objek, penjejakan gerakan dan analisis video.
VPU biasanya terdapat dalam:
• Kamera pintar
• Sistem pengawasan
• Robotik
• Kenderaan autonomi
• Sistem AR/VR
• Peranti penglihatan AI tepi
IPU (Unit Pemprosesan Perisikan) direka untuk AI yang sangat selari dan beban kerja pembelajaran mesin.Seni bina memberi tumpuan kepada meningkatkan kecekapan aliran data semasa pelaksanaan rangkaian saraf berskala besar.
IPU digunakan untuk:
• Pecutan pembelajaran mesin
• Pengecaman corak
• Inferens AI
• Pemprosesan tensor selari
• Penyelidikan AI lanjutan
BPU (Unit Pemprosesan Otak) dioptimumkan untuk AI tertanam dan sistem kecerdasan tepi.Pemproses ini menumpukan pada inferens AI tempatan yang pantas dengan penggunaan kuasa yang lebih rendah.
BPU biasanya digunakan dalam:
• Sistem penderiaan pintar
• Robotik
• Perkakasan Edge AI
• Sistem pengesanan gerakan
• Platform autonomi
HPU (Unit Pemprosesan Holografik) direka untuk pengkomputeran holografik, realiti campuran dan sistem analisis spatial.
Proses bantuan HPU:
• Pemetaan alam sekitar
• Penjejakan gerakan
• Gabungan sensor
• Interaksi spatial masa nyata
• Persekitaran AR/VR
MPU (Unit Pemproses Mikro) dan MCU (Unit Pengawal Mikro) digunakan secara meluas dalam sistem terbenam dan elektronik berkuasa rendah.
MPU biasanya digunakan dalam sistem pengkomputeran terbenam yang memerlukan kawalan peringkat sistem pengendalian, manakala MCU menyepadukan teras pemproses, memori dan kawalan input/output ke dalam cip padat untuk tugasan kuasa rendah khusus.
Pemproses ini biasanya terdapat dalam:
• Peranti IoT
• Pengawal industri
• Elektronik automotif
• Peralatan rumah
• Sistem terbenam mudah alih
APU (Unit Pemprosesan Dipercepat) menggabungkan fungsi CPU dan GPU di dalam satu pakej pemproses.Penyepaduan ini meningkatkan kecekapan kuasa, mengurangkan saiz perkakasan dan membenarkan beban kerja pengkomputeran dan grafik berkongsi sumber sistem dengan lebih cekap.
APU biasanya digunakan dalam:
• Komputer riba
• Mini PC
• Sistem permainan peringkat permulaan
• Peranti multimedia
• Platform pengkomputeran mudah alih
Sistem pengkomputeran moden jarang bergantung pada seni bina pemproses tunggal.Sebaliknya, peranti menggabungkan berbilang pemproses khusus bersama-sama kerana beban kerja yang berbeza memerlukan kaedah pemprosesan yang berbeza.
Sebagai contoh, sistem moden boleh menggunakan:
• CPU untuk kawalan sistem
• GPU untuk grafik dan pengiraan selari
• NPU untuk inferens AI
• VPU untuk penglihatan komputer
• DPU untuk rangkaian dan pergerakan data
• MCU untuk tugas kawalan terbenam
Dengan mengagihkan beban kerja merentas perkakasan khusus, sistem moden mencapai prestasi yang lebih baik, kependaman yang lebih rendah, kecekapan tenaga yang dipertingkatkan dan pemprosesan masa nyata yang lebih berkesan merentas AI, grafik, rangkaian dan persekitaran pengkomputeran terbenam.
NPU menjadi penting dalam pengkomputeran moden kerana ia membenarkan tugas AI dijalankan secara tempatan, cepat dan cekap tanpa banyak bergantung pada pemprosesan awan.Seni bina yang dioptimumkan mereka mengurangkan kependaman, penggunaan kuasa, pergerakan memori dan penjanaan haba, menjadikannya berharga dalam telefon pintar, robotik, peranti penjagaan kesihatan, automasi industri, rumah pintar, sistem autonomi dan platform AI kelebihan.Apabila model AI menjadi lebih besar dan lebih kompleks, NPU masa hadapan akan terus bertambah baik melalui seni bina yang lebih pintar, pengkomputeran ketepatan rendah, pemprosesan dalam memori, sokongan model besar tempatan, reka bentuk semikonduktor termaju dan ciri keselamatan AI yang lebih kukuh.
NPU lebih cekap kerana perkakasannya direka khusus untuk pengiraan AI dan bukannya pemprosesan tujuan umum.CPU mengendalikan banyak tugas sistem yang berbeza secara berurutan, manakala NPU memfokuskan terutamanya pada operasi tensor, pendaraban matriks, lilitan dan pemprosesan rangkaian saraf selari.Ini membolehkan NPU melengkapkan inferens AI dengan lebih pantas sambil menggunakan kurang kuasa dan kurang menjana haba.
NPU membahagikan beban kerja AI kepada banyak operasi yang lebih kecil yang berjalan serentak merentas berbilang unit pengkomputeran.Daripada menunggu satu arahan selesai sebelum memulakan yang lain, sejumlah besar data rangkaian saraf bergerak melalui pemproses secara selari.Ini meningkatkan daya pengeluaran dengan ketara dan mengurangkan kependaman semasa beban kerja seperti pengecaman imej, pemprosesan pertuturan dan pengesanan objek masa nyata.
Banyak model AI tidak memerlukan ketepatan berangka yang sangat tinggi untuk menghasilkan keputusan yang tepat.NPU menggunakan format seperti INT8 dan FP16 untuk mengurangkan penggunaan memori dan overhed pengiraan.Pemprosesan ketepatan lebih rendah membolehkan lebih banyak operasi disiapkan dalam masa yang singkat sambil meningkatkan kecekapan tenaga dan mengekalkan prestasi inferens AI yang kukuh.
NPU meletakkan memori dan perkakasan pengiraan lebih rapat di dalam seni bina pemproses.Daripada berulang kali memindahkan sejumlah besar data tensor antara memori luaran dan teras pemprosesan, banyak operasi perantaraan kekal berhampiran unit pelaksanaan.Ini memendekkan laluan data, mengurangkan penggunaan lebar jalur, merendahkan kependaman dan meningkatkan kecekapan kuasa keseluruhan.
Peranti moden memerlukan pemprosesan AI tempatan yang pantas dengan penggunaan kuasa yang rendah dan kependaman yang minimum.NPU membenarkan telefon pintar dan sistem tepi melaksanakan tugas AI seperti pengecaman muka, fotografi AI, interaksi suara dan pengesanan objek secara langsung pada peranti tanpa banyak bergantung pada pelayan awan.Ini meningkatkan tindak balas, privasi dan kecekapan bateri.
Unit Darab-Terkumpul (MAC) mengendalikan operasi pendaraban dan penambahan berulang yang digunakan di seluruh rangkaian saraf.NPU moden mengandungi ratusan atau ribuan unit MAC yang berfungsi serentak, membolehkan beban kerja AI yang besar diproses dengan lebih pantas berbanding pemproses berjujukan tradisional.
GPU dan NPU dioptimumkan untuk beban kerja yang berbeza.GPU cemerlang dalam latihan AI berskala besar, pemaparan grafik dan pengiraan selari berprestasi tinggi, manakala NPU dioptimumkan untuk inferens AI berkuasa rendah dan pemprosesan tempatan masa nyata.Menggunakan kedua-dua pemproses bersama-sama membolehkan sistem mengimbangi fleksibiliti, prestasi dan kecekapan tenaga.
Sistem robotik dan autonomi secara berterusan memproses input kamera, pemetaan persekitaran, data penderia dan analisis gerakan.NPU mempercepatkan beban kerja ini secara tempatan dengan kependaman rendah, membolehkan sistem bertindak balas dengan cepat semasa navigasi, pengesanan halangan, pengecaman pejalan kaki dan membuat keputusan masa nyata.
AI pada peranti mengurangkan pergantungan pada pengkomputeran awan dengan membenarkan model AI berjalan terus pada perkakasan tempatan.Ini meningkatkan privasi, mengurangkan penggunaan lebar jalur rangkaian dan membolehkan respons masa nyata yang lebih pantas.NPU masa depan dijangka menyokong model AI tempatan yang lebih besar, pemprosesan AI multimodal dan beban kerja AI generatif lanjutan secara langsung di dalam peranti pengguna dan industri.
NPU masa hadapan mungkin akan menggunakan peruntukan beban kerja yang lebih bijak, pengkomputeran jarang, pemprosesan dalam memori, seni bina serpihan dan kawalan ketepatan penyesuaian untuk meningkatkan kecekapan.Teknologi ini bertujuan untuk mengurangkan pengiraan yang tidak perlu, mengurangkan penggunaan kuasa dan meningkatkan daya pengeluaran sambil menyokong model AI yang lebih besar dan lebih maju merentas peranti tepi, robotik, sistem perindustrian dan elektronik pengguna pintar.
2024/07/29
2024/08/28
2024/10/6
2024/07/4
2024/04/22
2024/07/15
2023/12/28
2024/11/15
2025/09/20
2024/07/10









