^{<big id="qd94c"></big>}

<td id="qd94c"><strike id="qd94c"></strike></td>

<p id="qd94c"><del id="qd94c"></del></p>

<table id="qd94c"><noscript id="qd94c"></noscript></table>

<pre id="qd94c"></pre>

<td id="qd94c"><option id="qd94c"></option></td>

集團首頁
走進pg電子,pg電子官方網站,pg娛樂電子游戲官網
走進pg電子,pg電子官方網站,pg娛樂電子游戲官網

山東pg電子,pg電子官方網站,pg娛樂電子游戲官網集團有限公司是一家綜合體育集IM體育、小金體育、博亞體育、愛游戲等股份制集團公司，集團總部坐落于“世界風箏之都”—濰坊，集團占地面積1079畝，總資產56億元，現有職工3300人，2019年實現產值61.4億元、納稅2億元、創匯5600萬美元。

集團簡介

集團榮譽

資質認證

集團風貌
集團產業
pg電子,pg電子官方網站,pg娛樂電子游戲官網產業

憑借專業的科研團隊和先進的技術工藝，迅速崛起，現已發展為涉足英雄聯盟、新材料，建材，歐冠，英超，西甲，意甲，法甲，LOL競猜，生物科技，五大聯賽，國際貿易，高檔釉料等領域的大型現代化集團公司。

新能源

新材料

建材

現代物流

生物科技

農業科技

國際貿易

高檔釉料
新聞中心
新聞中心

堅持“團結一致，干事創業”的企業理念，提倡“真誠，團結，足協杯，女足敬業，奮斗”的企業精神。
企業文化
企業文化

NBA籃彩，精益求精，追求完美品質，持續改進，超越客戶期望。
申花，誠信為本，打造核心競爭力，強化危機意識，實現百年創業。

企業理念

黨建之窗

員工風采
社會責任
社會責任

長春亞泰樂善好施，是中華民族的傳統美德；扶危助困，是社會各界的共同責任。企業在發展中，只有自覺承擔體彩足球，才能實現經濟與社會效益的雙贏，成就百年基業。

綠色環保

公益事業
人力資源
人力資源

國以才立，業以才興。人才是企業發展的根本，是推動企業跨越式發展的第一生產力。pg電子,pg電子官方網站,pg娛樂電子游戲官網集團重視團隊建設，多渠道引進人才、高效機制培養人才、廣闊平臺晉升人才，為企業在激烈競爭中立于不敗之地提供強有力的保障。

人才招聘

在線應聘
聯系pg電子,pg電子官方網站,pg娛樂電子游戲官網
聯系pg電子,pg電子官方網站,pg娛樂電子游戲官網

pg電子,pg電子官方網站,pg娛樂電子游戲官網集團憑借雄厚的資金實力，高素質的專業人才和優質高效的服務，在社會上樹立起了良好的企業形象，受到了廣大客戶和社會各界普遍的信賴和贊譽！

聯系方式

在線地圖

您的位置:首頁 > 新聞中心新聞中心

【pg電子·(中國)娛樂官方網站】專攻芯片設計，英偉達推出定制版大語言模型ChipNeMo！

發布時間:2023-11-04 14:23:28 作者：pg電子,pg電子官方網站,pg娛樂電子游戲官網

新智元報道

編輯：好困

【新智元導讀】英偉達：大語言模型或將全面加持芯片設計全流程！

在剛剛開幕的芯片型ICCAD 2023大會上，英偉達團隊展示了用AI模型測試芯片，設計pg電子·(中國)娛樂官方網站引發了業界關注。英偉言模

眾所周知，達推大語半導體設計是出定一項極具挑戰性的工作。

在顯微鏡下，專攻制版諸如英偉達H100這樣的芯片型頂級芯片，看起來就像是設計一個精心規劃的大都市，這其中的英偉言模數百億個晶體管則連接在比頭發絲還要細一萬倍的街道上。

為了建造這樣一座數字巨城，需要多個工程團隊長達兩年時間的出定合作。

其中，專攻制版一些小組負責確定芯片的芯片型整體架構，一些小組負責制作和放置各種超小型電路，設計還有一些小組負責進行測試。每項工作都需要專門的方法、軟件程序和計算機語言。

ChipNeMo：英偉達版「芯片設計」大模型

最近，來自英偉達的pg電子·(中國)娛樂官方網站研究團隊開發了一種名為ChipNeMo的定制LLM，以公司內部數據為基礎進行訓練，用于生成和優化軟件，并為人類設計師提供幫助。

論文地址：https://research.nvidia.com/publication/2023-10_chipnemo-domain-adapted-llms-chip-design

研究人員并沒有直接部署現成的商業或開源LLM，而是采用了以下領域適應技術：自定義分詞器、領域自適應持續預訓練（DAPT）、具有特定領域指令的監督微調（SFT），以及適應領域的檢索模型。

結果表明，與通用基礎模型相比（如擁有700億個參數的Llama 2），這些領域適應技術能夠顯著提高LLM的性能——

不僅在一系列設計任務中實現了類似或更好的性能，而且還使模型的規?？s小了5倍之多（定制的ChipNeMo模型只有130億個參數）。

具體來說，研究人員在三種芯片設計應用中進行了評估：工程助理聊天機器人、EDA腳本生成，以及錯誤總結和分析。

其中，聊天機器人可以回答各類關于GPU架構和設計的問題，并且幫助不少工程師快速找到了技術文檔。

代碼生成器已經可以用芯片設計常用的兩種專業語言，創建大約10-20行的代碼片段了。

代碼生成器

而最受歡迎分析工具，可以自動完成維護更新錯誤描述這一非常耗時的任務。

對此，英偉達首席科學家Bill Dally表示，即使我們只將生產力提高了5%，也是一個巨大的勝利。

而ChipNeMo，便是LLM在復雜的半導體設計領域，邁出的重要的第一步。

這也意味著，對于高度專業化的領域，完全可以利用其內部數據來訓練有用的生成式AI模型。

數據

為了構建領域自適應預訓練（DAPT）所需的數據，研究人員同時結合了英偉達自己的芯片設計數據，以及其他公開可用的數據。

經過采集、清洗、過濾，內部數據訓練語料庫共擁有231億個token，涵蓋設計、驗證、基礎設施，以及相關的內部文檔。

就公共數據而言，研究人員重用了Llama2中使用的預訓練數據，目的是在DAPT期間保留一般知識和自然語言能力。

在代碼部分，則重點關注了GitHub中與芯片設計相關的編程語言，如C++、Python和Verilog。

在監督微調 (SFT) 過程中，研究人員選取了可商用的通用聊天SFT指令數據集，并制作了的特定領域指令數據集。

為了快速、定量地評估各種模型的準確性，研究人員還構建了專門的評估標準——AutoEval，形式類似于MMLU所采用的多選題。

訓練

ChipNeMo采用了多種領域適應技術，包括用于芯片設計數據的自定義分詞器、使用大量領域數據進行領域自適應預訓練、使用特定領域任務進行監督微調，以及使用微調檢索模型進行檢索增強。

首先，預訓練分詞器可以提高特定領域數據的分詞效率，保持通用數據集的效率和語言模型性能，并最大限度地減少重新訓練/微調的工作量。

其次，研究人員采用了標準的自回歸語言建模目標，并對特定領域的數據進行了更深入的預訓練。

在DAPT之后，則進一步利用監督微調（SFT）來實現模型的對齊。

針對大模型的幻覺問題，研究人員選擇了檢索增強生成（RAG）的方法。

研究人員發現，在RAG中使用與領域相適應的語言模型可以顯著提高特定領域問題的答案質量。

此外，使用適量的特定領域訓練數據對現成的無監督預訓練稠密檢索模型進行微調，可顯著提高檢索準確率。

結果

首先，自適應的分詞器可以在各種芯片設計數據集中，將分詞效率提高1.6%至3.3%。

其次， ChipNeMo模型在芯片設計領域基準AutoEval和開放領域學術基準上的測試結果顯示：

1. DAPT模型在開放領域學術基準上的準確性略有下降。

2. DAPT對領域本身的任務產生了積極的影響。其中，模型對于內部設計和電路設計的知識水平顯著提高。

3. 使用規模更大、性能更強的基礎模型，可以在特定領域任務中獲得更好的結果。

4. DAPT對域內任務的改進與模型大小呈正相關，較大的模型在DAPT后對特定領域任務性能的提升更為明顯。

所有模型均使用128個A100 GPU進行訓練。研究人員估算了與ChipNeMo領域自適應預訓練相關的成本，如下表所示。

值得注意的是，DAPT占從頭開始預訓練基礎模型總成本的不到1.5%。

RAG和工程助理聊天機器人

研究人員對使用和不使用RAG的多個ChipNeMo模型和Llama 2模型進行了評估，結果如圖8所示：

- RAG可以大幅提升模型的得分，即便RAG未命中，分數通常也會更高。

- ChipNeMo-13B-Chat獲得的分數比類似規模的Llama2-13B-Chat更高。

- 使用RAG的ChipNeMo-13B-Chat與使用RAG的Llama2-70B-Chat獲得了相同的分數（7.4）。當RAG命中時，Llama2-70B-Chat得分更高；但RAG未命中時，具有領域適應的ChipNeMo表現更好。

- 領域SFT使ChipNeMo-13B-Chat的性能提高了0.28（有 RAG）和0.33（無 RAG）。

EDA腳本生成

從圖9中可以看出，DAPT補足了模型對底層API的知識，而領域域SFT進一步改善了結果。

一個有趣的結果是，LLaMA2-70B似乎可以借助卓越的通用Python編碼能力，來解決尚未接受過訓練的新問題。但由于它幾乎沒有接觸過Tcl代碼，因此在該工具上的表現較差。

而這也凸顯了DAPT在小眾或專有編程語言方面的優勢。

Bug總結與分析

結果如圖10所示，ChipNeMo-13B-Chat模型在所有三項任務上均優于基本LLaMA2-13B-Chat模型，分別將技術總結、管理總結和任務推薦的分數提高了0.82、1.09和0.61。

此外，領域SFT也顯著提高了模型在管理總結和任務分配方面的性能。

不過，Llama2-70B-Chat模型在所有任務上表現都要比ChipNeMo-13B更加出色。

雖然較大的Llama2 70B有時也可以達到與ChipNeMo相似的精度，如圖8、9和10所示。但考慮較小規模的模型所帶來的成本效益，也同樣重要。

比如，與Llama2 70B不同，英偉達的ChipNeMo 13B可以直接加載到單個A100 GPU的顯存中，且無需任何量化。這使得模型的推理速度可以得到大幅提升。與此同時，相關研究也表明，8B模型的推理成本就要比62B模型低8-12倍。

因此，在生產環境中決定使用較大的通用模型還是較小的專用模型時，必須考慮以下標準：

- 訓練和推理權衡：

較小的領域適應模型可以媲美更大的通用模型。雖然領域適應會產生額外的前期成本，但使用較小的模型可以顯著降低運營成本。

- 用例獨特性：

從圖6、9和10中可以看出，領域適應模型模型在很少出現在公共領域的任務中表現極佳，如用專有語言或庫編寫代碼。而對于通用大模型來說，即使提供了精心挑選的上下文，也很難在這種情況下與領域適應模型的準確性相媲美。

- 領域數據可用性：

當存在大量訓練數據（數十億訓練token）時，領域適應效果最好。對于積累了大量內部文檔和代碼的公司和項目來說，情況通常如此，但對于較小的企業或項目則不一定。

- 用例多樣性：

雖然可以針對特定任務微調通用模型，但領域適應模型可以適用于領域中的各種任務。

總的來說，領域自適應預訓練模型（如ChipNeMo-13B-Chat）通?？梢匀〉帽绕浠A模型更好的結果，并且可以縮小與規模更大的模型（如Llama2 70B）之間的差距。

參考資料：

https://blogs.nvidia.com/blog/2023/10/30/llm-semiconductors-chip-nemo/

https://spectrum.ieee.org/ai-for-engineering

　

下一篇：媒體人：蓉城坐五探四望三想亞冠想創歷史最好成績必須贏梅州
上一篇：大將之風！生涯前6場命中13+三分并有13+蓋帽霍姆格倫成歷史首人

© 版權所有：山東pg電子,pg電子官方網站,pg娛樂電子游戲官網集團有限公司

技術支持：

精品久久久久久久久_一级全黄少妇性色生活片_免费国产香蕉视频在线观看

^{<big id="qd94c"></big>}

<td id="qd94c"><strike id="qd94c"></strike></td>

<p id="qd94c"><del id="qd94c"></del></p>

<table id="qd94c"><noscript id="qd94c"></noscript></table>

<pre id="qd94c"></pre>

<td id="qd94c"><option id="qd94c"></option></td>