研電賽.
研電賽官方服務(wù)平臺
20th
“AMD”命題
第二十屆中國研究生電子設(shè)計競賽
AMD成立于1969年,總部位于美國加州圣克拉拉,現(xiàn)已發(fā)展為全球領(lǐng)先的高性能與自適應(yīng)計算公司,全球員工超過28,000名(截至2025年3月)。公司產(chǎn)品涵蓋CPU、GPU、FPGA、DPU及系統(tǒng)級芯片,并結(jié)合強大的軟件能力,廣泛應(yīng)用于云端、邊緣和終端設(shè)備。
AMD致力于推動人工智能發(fā)展,提供端到端的AI訓(xùn)練與推理解決方案,構(gòu)建開放生態(tài)系統(tǒng),并積極與中國生態(tài)伙伴合作,助力產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型。
中國是AMD全球戰(zhàn)略的重要市場。自1993年進入中國以來,AMD不斷擴大在華投入,業(yè)務(wù)涵蓋產(chǎn)品銷售、戰(zhàn)略合作、新品開發(fā)等。2004年成立大中華區(qū)總部,現(xiàn)由高級副總裁潘曉明領(lǐng)導(dǎo)。
2006年,AMD在上海設(shè)立研發(fā)中心,以上海研發(fā)中心為主體的中國研發(fā)中心逐漸發(fā)展壯大,現(xiàn)已成為全球研發(fā)體系的重要組成,擁有超4,000名研發(fā)人員,覆蓋芯片設(shè)計、軟件開發(fā)與系統(tǒng)測試,并與本地客戶緊密合作,推動技術(shù)落地。近年來,AMD在AI創(chuàng)新與可持續(xù)發(fā)展方面表現(xiàn)突出,榮獲“2023年度杰出可持續(xù)創(chuàng)新企業(yè)”“2023-2024年度最受尊敬企業(yè)”稱號,2024“世界互聯(lián)網(wǎng)大會杰出貢獻獎”等多項榮譽。
一等獎:1名¥10,000
二等獎:2名¥5,000
三等獎:3名¥2,000
(一)報名截止時間:2025年7月15日24:00。
(二)作品提交截止時間:2025年7月20日24:00。
(三)報名方式:采用線下報名方式,報名截止前完成報名費繳納,并將參賽作品打包壓縮,與線下報名表(見附件)、繳費憑證一并發(fā)送至官方郵箱。建議優(yōu)先提交報名表,便于命題企業(yè)提供技術(shù)支持。
(四)報名郵箱:CIEEDA 163.COM
(五)繳費賬號(線下轉(zhuǎn)賬):
1.開戶名稱:中國電子學(xué)會
2.賬號:9558850200000514831
(六)其他:
1.7月15日報名截止后,秘書處將組織團隊在官網(wǎng)完善信息并生成獲獎證書,電子發(fā)票將發(fā)至隊長郵箱。
2.線下報名僅延長截止時間,不影響其他賽程安排。
賽題一:
基于ROCm on Radeon?平臺的
DeepSeek大語言模型部署性能優(yōu)化
1、賽題描述:
隨著AMD ROCm軟件棧對RDNA3架構(gòu)支持的不斷完善,面向?qū)I(yè)及創(chuàng)意人士設(shè)計的AMD Radeon?PRO W7000系列工作站顯卡,憑借其卓越的48GB GDDR6顯存容量,正逐步成為應(yīng)對當(dāng)前AI開發(fā)面臨的嚴峻挑戰(zhàn)時有效且經(jīng)濟的解決方案。目前,ROCm搭配W7000系工作站GPU的組合已支持大部分業(yè)內(nèi)主流的模型以及部署框架。
本命題要求參與者在搭載單張W7000工作站GPU的平臺上優(yōu)化使用vLLM框架部署DeepSeek-R1-Distill-Qwen-7B模型的性能。
建議的優(yōu)化方向包括但不限于:
提升常見算子(如Elementwise、GEMM等)的執(zhí)行效率,并對部署管線中的算子進行融合優(yōu)化。
ROCm on Radeon?對諸多量化方法(如AWQ、Marlin等)提供支持。
對算法使用的計算內(nèi)核(如Attention、MoE等)進行優(yōu)化。
2、提交要求:
參賽者應(yīng)基于指定代碼倉庫(如vLLM、PyTorch、Triton等)進行代碼更改,經(jīng)本地編譯驗證后提交code patch,并附上本地測試結(jié)果顯示的性能提升幅度。性能提升基于代碼改正,而非依靠部署參數(shù)調(diào)整。具體參數(shù)參見技術(shù)支持部分。
3、評分標準:
所有提交的代碼將統(tǒng)一在ROCm on Radeon?平臺上進行驗證,并根據(jù)性能提升的幅度進行排名。
基礎(chǔ)得分=優(yōu)化幅度百分比x 100
加分項:(由AMD評審團打分)
創(chuàng)新性(5分):優(yōu)化方案的原創(chuàng)程度及復(fù)雜程度。
實用性(5分):優(yōu)化方案對ROCm生態(tài)推廣的積極作用。
可讀性(2分):提交優(yōu)化方案的詳細闡述文檔或PPT。
4、硬件平臺配置:
(報名審核后,通知云服務(wù)申請表)
5、視頻教程:
在8卡AMD W7800運行DeepSeek R1鏈接:
https://www.bilibili.com/video/BV1i8j3zJExM
6、本地開發(fā)環(huán)境:
推薦使用AMD Radeon?PRO W7800
7、技術(shù)支持:
掃描二維碼加入技術(shù)支持QQ群:
8、軟件環(huán)境:
Benchmark教程(以修改vLLM為例)
(1)準備DeepSeek-R1-Distill-Qwen-7B模型和ShareGPT_V3_unfiltered_cleaned_split.json數(shù)據(jù)集
(2)推薦使用PyTorch-On-ROCm Docker Image創(chuàng)建container。
(3)在container內(nèi)安裝帶有本地修改的vLLM。
(4)啟動vLLM server
(1)運行benchmark并觀測結(jié)果
9、相關(guān)鏈接:
AMD Radeon?PRO W7800 Professional Graphics Specification:
https://www.amd.com/en/products/graphics/workstations/radeon-pro/w7800.html
Getting Started Guide:Using AMD ROCm?Software on Radeon?GPUs:
https://www.amd.com/en/developer/resources/ml-radeon.html
Inferencing and serving with vLLM on AMD GPUs:
https://rocm.blogs.amd.com/artificial-intelligence/vllm/README.html
賽題二:基于AMD APU系統(tǒng)的AI應(yīng)用開發(fā)(自由命題)
1.賽題描述:
AIPC(人工智能個人電腦)是一種集成AI技術(shù)的個人電腦,通過本地算力、自然語言交互、個性化大模型等核心能力,重構(gòu)傳統(tǒng)PC的體驗,使其從工具升級為“個人智能助理”。
參賽隊伍使用AMD指定的APU產(chǎn)品開發(fā)一個AI應(yīng)用,圍繞以下領(lǐng)域(包括但不限于):
AI應(yīng)用專業(yè)領(lǐng)域
AI應(yīng)用日常生活娛樂
AI PC與其他智能設(shè)備的鏈接與整合
補充說明:
(1)AIPC本地模型優(yōu)化方案:針對AI Agent等現(xiàn)有應(yīng)用,提出優(yōu)化其在AIPC本地運行效能的創(chuàng)新方案(可融合大預(yù)言模型LLM、計算機視覺CV、文本處理OCR、語音交互ASR等):
a.模型輕量化:應(yīng)用模型壓縮技術(shù)(量化、蒸餾、剪枝等),實現(xiàn)模型精簡與本地適配,兼顧精度。
評分依據(jù):優(yōu)化前后模型大小、推理性能、系統(tǒng)負載數(shù)據(jù)對比。
b.推理加速:采用優(yōu)化技術(shù)(算子、圖結(jié)構(gòu)、內(nèi)存管理等),提升本地推理效率(如prefill、token generation速度)。
評分依據(jù):性能提升量化數(shù)據(jù)。
(2)行業(yè)賦能方案:為教育、醫(yī)療、娛樂、辦公等場景,設(shè)計基于AIPC本地AI的創(chuàng)新應(yīng)用(例如:作業(yè)批改、病例分析、文章潤色)。
評分核心:創(chuàng)新性、實用性、可行性。
(3)其他
2、賽題要求:
2.1硬件環(huán)境
AIPC云平臺接入(報名審核后,通知云服務(wù)申請表)
型號:Beelink SER/處理器:AMD Ryzen HX370/內(nèi)存:32GB RAM/存儲:1TB SSD
操作系統(tǒng):Windows 11
外設(shè)請根據(jù)AI應(yīng)用設(shè)計自行配置
2.2 AI應(yīng)用的設(shè)計與實現(xiàn)
基于所提供的硬件環(huán)境,以及利用AMD推薦模型https://huggingface.co/amd或者自選模型,完成所選場景下的AI應(yīng)用開發(fā)。
參賽作品須提出創(chuàng)新的解決方案,展示其前瞻性的思考和設(shè)計。
參賽作品須具有實際的應(yīng)用價值。
參賽作品須充分發(fā)揮AMD產(chǎn)品的算力優(yōu)勢(iGPU,NPU,CPU)實現(xiàn)本地AI推理。
加分項:充分利用本地AI算力前提下,提升電源利用能效。
2.3賽題提交要求(初賽)
技術(shù)論文–Word文檔(必選)
視頻文件,限制3分鐘(必選)
門型展架,尺寸180cm*80cm(必選)
演示說明–PPT文檔(可選)
2.4賽題提交要求(決賽)
技術(shù)論文–Word文檔(必選)
演示說明–PPT文檔(必選)
3、評分標準:
3.1技術(shù)創(chuàng)新和實用性30%
AI應(yīng)用基于的模型(或模型組)
提出創(chuàng)新的解決方案
能夠有效地解決現(xiàn)實世界中的問題
復(fù)雜度和計算效率
示例:一個使用深度學(xué)習(xí)技術(shù)進行圖像分類的模型,若其準確率超過90%且計算速度快于現(xiàn)有方法,則會得高分。
3.2 AI應(yīng)用程序與用戶交互程度20%
示例:一個語音助手模型,若能根據(jù)用戶的口音和語調(diào)自適應(yīng),并提供直觀的界面,則會得高分。
3.3論文,PPT的清晰度與邏輯20%
文獻綜述全面、正確
方法描述清晰、易于理解
結(jié)果分析合理、令人信服
3.4功能完整度+穩(wěn)定性15%
完成所有預(yù)定任務(wù)
運行速度和穩(wěn)定性
示例:一個文本生成模型,若其能生成高質(zhì)量文本且運行速度快、穩(wěn)定,則會得高分。
3.5 Demo(現(xiàn)場直播、預(yù)先錄制視頻等形式)10%
清晰展示該應(yīng)用的功能和性能
可以幫助用戶輕松理解和使用該應(yīng)用
示例:一個人臉識別模型,若其Demo能快速、準確識別人臉并提供友好界面,則會得高分。
3.6用戶隱私數(shù)據(jù)是否受到保護5%
是否收集和存儲用戶的隱私數(shù)據(jù)
用戶的本地隱私數(shù)據(jù)是否加密
是否會將本地存儲的隱私數(shù)據(jù)上傳到網(wǎng)絡(luò)
是否有明確的隱私政策和使用條款
示例:一個社交媒體分析模型,若其在不收集用戶隱私數(shù)據(jù)的情況下完成分析,并提供清晰的隱私政策,則會得高分。
4、參考鏈接:
?AMD AI Solutions:
https://www.amd.com/en/solutions/ai.html
?AMD HIP SDK on Windows:
https://rocm.docs.amd.com/projects/install-on-windows/en/latest/index.html
?AMD Ryzen AI:
https://ryzenai.docs.amd.com/en/latest/index.html
5、賽題-競賽交流QQ群:
點擊閱讀原文下載報名表
https://mp.weixin.qq.com/s/nXOwdLGW0qO8aEyVg22STQ