01
參賽條件
本屆CICC大賽圍繞“創(chuàng)意數(shù)據(jù)集建設(shè)方案”,面向金融、醫(yī)療、具身智能、科學(xué)智能等11個領(lǐng)域的技術(shù)人才與創(chuàng)新團(tuán)隊發(fā)布具有挑戰(zhàn)性的賽題;本屆競賽面向中國及境內(nèi)外高等學(xué)校在讀學(xué)生(含本科、碩博研究生等)。
02
獎項設(shè)置
一等獎1名,5萬元;二等獎1名,3萬元;三等獎2名,1萬元。
03
報名截止時間
2025年6月30日
2025語料數(shù)據(jù)智能創(chuàng)意大賽
本次大賽錨定前沿領(lǐng)域,以深度挖掘高價值語料數(shù)據(jù)處理方案與場景應(yīng)用路徑為核心任務(wù),全力助推“模塑申城”語料普惠計劃落地生根,為人工智能產(chǎn)業(yè)筑牢語料數(shù)據(jù)根基。同時,大賽積極搭建產(chǎn)學(xué)研用協(xié)同創(chuàng)新平臺,以開放包容的姿態(tài)廣納各地頂尖團(tuán)隊投身語料數(shù)據(jù)開源生態(tài)建設(shè),讓多元知識與先進(jìn)技術(shù)在此碰撞交融,激發(fā)無限創(chuàng)新活力。
劃重點
01
賽程安排
報名啟動
2月22日GDC大會語料分論壇正式啟動“語料筑基智生時代”2025語料數(shù)據(jù)創(chuàng)意大賽,符合參賽條件的團(tuán)隊報名參賽。賽事注冊報名和參賽項目提交截止時間為2025年6月30日。
初賽評審
初賽采取線上評審方式進(jìn)行,評審專家依據(jù)報名階段各參賽隊伍提交的項目申報書等資料,參照評分規(guī)則要求,各賽道擇優(yōu)選拔進(jìn)入決賽項目。
決賽評審
決賽通過項目路演等方式進(jìn)行,各決賽參賽隊伍需自行準(zhǔn)備參賽項目答辯資料。決賽現(xiàn)場由參賽選手對參賽項目進(jìn)行介紹,可搭配視頻演示,評委進(jìn)行現(xiàn)場提問、打分,最終評出每個賽道的獲獎名次。決賽具體組織方式另行發(fā)布。
02
領(lǐng)域范圍
本屆CICC大賽圍繞“創(chuàng)意數(shù)據(jù)集建設(shè)方案”,面向金融、醫(yī)療、具身智能、科學(xué)智能等11個領(lǐng)域的技術(shù)人才與創(chuàng)新團(tuán)隊發(fā)布具有挑戰(zhàn)性的賽題,要求參賽選手圍繞明確需求、特定場景進(jìn)行數(shù)據(jù)處理,構(gòu)建具有創(chuàng)新思路、技術(shù)先進(jìn)與廣泛應(yīng)用能力的數(shù)據(jù)解決方案。
圍繞模塑申城5個關(guān)鍵領(lǐng)域、6大重點行業(yè),構(gòu)建對應(yīng)的行業(yè)特色語料數(shù)據(jù)集建設(shè)方案,并提交相應(yīng)的數(shù)據(jù)樣本。
03
報名要求
本屆競賽面向中國及境內(nèi)外高等學(xué)校在讀學(xué)生(含本科、碩博研究生等)、創(chuàng)業(yè)團(tuán)隊、個人、公司等,具體要求如下:
1、參賽隊員不限年齡、專業(yè);
2、可單人參賽或自由組隊,允許跨專業(yè)、跨學(xué)校、跨公司組隊;同一參賽隊員只允許報名一個賽道參加一個隊伍;報名只有一個主體單位;
3、參賽隊員報名須保證個人信息準(zhǔn)確并真實有效;
04
作品要求
一、智能終端
1.圍繞智能學(xué)習(xí)機(jī)等智能終端應(yīng)用上,結(jié)合基礎(chǔ)學(xué)科能力,構(gòu)建一套基于以下某一學(xué)科的推理數(shù)據(jù)集:語文、數(shù)據(jù),物理,化學(xué)、歷史、地理等。
2.圍繞智能安防終端,建立一套基于外形,情緒,聲音等多模態(tài)的數(shù)據(jù)集,作為模型預(yù)判風(fēng)險的依據(jù)。
3.以科學(xué)強(qiáng)國為主題,構(gòu)建一套基于AR,VR場景的多模態(tài)數(shù)據(jù)集,使用戶能在生成數(shù)據(jù)中感受到科技發(fā)展進(jìn)步。
4.以健康為目的,提供基于心率、睡眠、運動、作息習(xí)慣等數(shù)據(jù),并給出健康改善建議的數(shù)據(jù)集。
二、科學(xué)智能
1.圍繞科學(xué)文獻(xiàn)與實驗數(shù)據(jù)設(shè)計結(jié)構(gòu)化提取方案,如化學(xué)分子式、生物基因序列的自動標(biāo)注。
2.圍繞多模態(tài)一致性驗證進(jìn)行方案設(shè)計,警如知識圖譜、公式、圖表及分子式與文本描述一致性、邏輯性驗證。
3.為提高撰寫科研專題綜述所需的文獻(xiàn)檢索精準(zhǔn)度與內(nèi)容提取效率,設(shè)計原始文獻(xiàn)的標(biāo)注方案、不同模態(tài)的結(jié)構(gòu)化數(shù)據(jù)高質(zhì)量語料化方案、以及基于思維鏈的綜述生成數(shù)據(jù)集。
三、在線新經(jīng)濟(jì)
1.圍繞互聯(lián)網(wǎng)用戶的評論和用戶行為數(shù)據(jù),探索一套基于正確價值觀體系的數(shù)據(jù)審核數(shù)據(jù)集。
2.圍繞電商商品信息,用戶評論,銷售量等信息,組建一套具有高可用性的優(yōu)質(zhì)商品推薦數(shù)據(jù)集,供個性化推薦模型進(jìn)行優(yōu)質(zhì)商品推薦。
3.基于在線虛擬好友陪聊業(yè)務(wù),構(gòu)建健康,有不同人物標(biāo)簽,貼近生活,口語化的陪聊對話數(shù)據(jù)集,面向不同年齡層次,不同性別,不同文化程度,不同性格等。
4.基于工業(yè)互聯(lián)網(wǎng)業(yè)務(wù),在以下某一行業(yè):鋼鐵,水務(wù),電力等上,建立一套語料的標(biāo)準(zhǔn),綜合考慮數(shù)據(jù)的可用性、結(jié)構(gòu)的統(tǒng)一性、數(shù)據(jù)的安全性等因素。
四、自動駕駛
1.多模態(tài)駕駛場景語料數(shù)據(jù)集,基于激光雷達(dá)、攝像頭等多傳感器數(shù)據(jù),構(gòu)建涵蓋復(fù)雜路況(如雨雪、夜間)的跨模態(tài)語料庫,實現(xiàn)多源數(shù)據(jù)清洗、對齊與標(biāo)注,提升自動駕駛系統(tǒng)感知魯棒性。
2.稀缺場景動態(tài)決策思維鏈數(shù)據(jù)集,針對突發(fā)障礙物、極端天氣等長尾場景,生成包含感知-決策-控制全鏈路的思維鏈數(shù)據(jù)集,優(yōu)化大模型在低資源條件下的推理能力。
3.高精度BEV(鳥瞰視圖)語料數(shù)據(jù)集,對城市道路BEV數(shù)據(jù)進(jìn)行語義分割標(biāo)注(車道線、交通參與者等),生成高精度、低噪聲的稀缺數(shù)據(jù)集,推動BEV感知算法迭代。
五、具身智能
1.構(gòu)建人形機(jī)器人數(shù)據(jù)質(zhì)量評價數(shù)據(jù)集,圍繞基礎(chǔ)能力測評“單模態(tài)、多模態(tài)”、場景能力測評"服務(wù)場景、生活場景”、專業(yè)認(rèn)知能力測評“大腦、小腦”等測評框架,加強(qiáng)具身智能大腦軟硬一體發(fā)展的評估和認(rèn)定。
2.圍繞生產(chǎn)伴隨式物理采集場景,提供創(chuàng)新具身語料數(shù)據(jù)采集方案,建設(shè)商超、辦公場景的語料數(shù)據(jù)庫,旨在提升機(jī)器人在真實物理環(huán)境中的感知能力和決策能力。
3.構(gòu)建遙操作模式下的合成數(shù)據(jù)語料庫,包含視覺、觸覺、語音等多模態(tài)數(shù)據(jù)的合成數(shù)據(jù)集。數(shù)據(jù)集需滿足機(jī)器人在多場景任務(wù)執(zhí)行中的需求,支持機(jī)器人自我學(xué)習(xí)與任務(wù)執(zhí)行能力的提升。
4.圍繞生活、服務(wù)、工業(yè)、實驗室四大類,設(shè)計和規(guī)劃多元化的應(yīng)用場景,生成具身智能機(jī)器人動作指令語料方案,如家庭服務(wù)場景中的“整理-收納-避障”多任務(wù)指令集。
5.構(gòu)建具身智能多模態(tài)感知語料數(shù)據(jù)集方案,需融合視覺、觸覺、語音等交互數(shù)據(jù),數(shù)據(jù)集需滿足機(jī)器人在家庭、工業(yè)、服務(wù)等多場景的任務(wù)執(zhí)行與自我學(xué)習(xí)能力需要。
六、金融
1.基金投研助手場景:基金投研助手旨在為投資者、基金經(jīng)理和研究分析師提供智能化支持,幫助其高效完成基金分析、市場研究、投資決策等工作。能夠快速提取并分析基金的歷史業(yè)績、持倉信息、風(fēng)險指標(biāo)等,滿足用戶基金數(shù)據(jù)分析的要求。這其中涉及到行業(yè)知識、基金相關(guān)數(shù)據(jù)、新聞與公告數(shù)據(jù)等。針對基金投研助手場景,以優(yōu)化落地效果為目標(biāo),設(shè)計出對應(yīng)的數(shù)據(jù)集制作方案,以包含“需求分析-數(shù)據(jù)準(zhǔn)備-測試與驗證-迭代與更新為佳”。
2.投資顧問助手場景:能夠為用戶提供專業(yè)、個性化的投資建議和服務(wù),幫助用戶識別投資風(fēng)險,提供風(fēng)險預(yù)警和應(yīng)對策略;能通過自然語言交互解答用戶問題,并提供投資知識普及服務(wù)等。關(guān)于投資顧問助手?jǐn)?shù)據(jù)設(shè)計方案,可以制定該場景“為用戶提供智能化、個性化的投資服務(wù),幫助用戶實現(xiàn)財富增值目標(biāo)”的高質(zhì)量數(shù)據(jù)集方案,以包含“需求分析-數(shù)據(jù)準(zhǔn)備-測試與驗證-迭代與更新為佳”。
3.風(fēng)險合規(guī)助手場景:金融風(fēng)險合規(guī)助手旨在幫助金融機(jī)構(gòu)(如銀行、證券公司、保險公司等)高效管理風(fēng)險、確保合規(guī)運營,同時降低人工成本。期望達(dá)到風(fēng)險監(jiān)管評估功能,如實時監(jiān)控交易、客戶行為和市場動態(tài),識別潛在風(fēng)險;合規(guī)檢查與報告功能,自動檢查業(yè)務(wù)操作是否符合法律法規(guī),生成合規(guī)報告;政策4.解讀與更新:及時解讀最新監(jiān)管政策,并提供合規(guī)建議??梢試@該場景訓(xùn)練以及落地效果優(yōu)化制定相關(guān)高質(zhì)量數(shù)據(jù)集。
5.市場資訊與宏觀政策解讀助手場景:市場資訊與宏觀政策解讀助手旨在為投資者、金融機(jī)構(gòu)和企業(yè)提供實時、精準(zhǔn)的市場動態(tài)和宏觀政策解讀,幫助用戶快速理解市場趨勢和政策影響,輔助決策制定。該功能需滿足實時資訊推送與解讀,對宏觀政策進(jìn)行深入解讀,同時可以分析其對行業(yè)、市場和企業(yè)的影響。針對該場景,制定數(shù)據(jù)集構(gòu)建方案。
七、制造
1.工業(yè)生產(chǎn)流程優(yōu)化:整合生產(chǎn)設(shè)備運行數(shù)據(jù)、工藝流程圖紙、質(zhì)量檢測報告等跨模態(tài)數(shù)據(jù),構(gòu)建生產(chǎn)流程優(yōu)化模型,挖掘生產(chǎn)環(huán)節(jié)中的潛在問題與優(yōu)化路徑。
2.工業(yè)安全風(fēng)險防控:收集工業(yè)生產(chǎn)中的安全事故案例、安全規(guī)范文檔、風(fēng)險監(jiān)測數(shù)據(jù),標(biāo)注事故原因、風(fēng)險防控要點與應(yīng)急處理流程。
八、教育
1.高等教育數(shù)理學(xué)科思維鏈:收集從數(shù)學(xué)、物理、化學(xué)等數(shù)理學(xué)科的基礎(chǔ)概念解析到復(fù)雜問題求解過程的詳細(xì)步驟,包括學(xué)生的思考過程記錄、解題思路推導(dǎo)過程的批注,構(gòu)建涵蓋從基礎(chǔ)到高階知識體系的思維鏈推理數(shù)據(jù)集合。
2.圍繞智慧教育中個性化學(xué)習(xí)方案的制定:基于多模態(tài)語料數(shù)據(jù),結(jié)合學(xué)生學(xué)習(xí)行為數(shù)據(jù)、課程評價數(shù)據(jù)、知識圖譜數(shù)據(jù)等多源信息,設(shè)計整體構(gòu)建方案。方案需包含語料數(shù)據(jù)庫構(gòu)建,且要保證數(shù)據(jù)在學(xué)生隱私保護(hù)前提下的安全性與可用性,實現(xiàn)對學(xué)生學(xué)習(xí)情況的精準(zhǔn)分析,為個性化學(xué)習(xí)路徑規(guī)劃提供支撐。
3.智能化教育數(shù)據(jù)質(zhì)控:針對來自不同渠道(如在線課程平臺、學(xué)校管理系統(tǒng))的學(xué)生作業(yè)、考試成績、課堂參與度等多模態(tài)數(shù)據(jù),設(shè)計一種統(tǒng)一的數(shù)據(jù)整合與質(zhì)量控制方案。提高教師對學(xué)生學(xué)習(xí)情況的全面了解以及教學(xué)質(zhì)量評估的準(zhǔn)確性,利用數(shù)據(jù)分析提高學(xué)生學(xué)習(xí)成果的預(yù)測精度,為個性化學(xué)習(xí)提供支持。
4.教育內(nèi)容跨模態(tài)轉(zhuǎn)換對齊:圍繞教材、教學(xué)視頻、課后練習(xí)等教育資源的跨模態(tài)轉(zhuǎn)換,設(shè)計一套教育內(nèi)容精準(zhǔn)關(guān)聯(lián)標(biāo)注方案。要求包括:①如何利用自然語言處理(NLP)和計算機(jī)視覺(CV)技術(shù)實現(xiàn)文本與圖像、視頻間的精準(zhǔn)匹配。②開發(fā)一個能夠自動推薦相關(guān)學(xué)習(xí)資源、輔助教師備課及學(xué)生自學(xué)的智能助手。
九、醫(yī)療
1.圍繞醫(yī)療影像、病理、診斷文本等醫(yī)療報告跨模態(tài)轉(zhuǎn)換對齊,設(shè)計醫(yī)療影像與診斷報告精準(zhǔn)關(guān)聯(lián)標(biāo)注方案,需包含技術(shù)實現(xiàn)路徑及智能體設(shè)計應(yīng)用。
2.圍繞智能電子病歷質(zhì)控,設(shè)計多模態(tài)多來源數(shù)據(jù)的統(tǒng)一與對齊,實現(xiàn)智能化的病歷質(zhì)控提高醫(yī)生病歷質(zhì)量以及病歷質(zhì)量管理的效率。
3.在機(jī)構(gòu)養(yǎng)老和居家養(yǎng)老的場景下,利用智能體,對基礎(chǔ)數(shù)據(jù)與實時交互數(shù)據(jù),提高風(fēng)險預(yù)測與老年人照護(hù)水平。
十、文旅
1.文化遺產(chǎn)多模態(tài)語料集,整合古籍文本、文物影像、歷史事件時間軸等跨模態(tài)數(shù)據(jù),構(gòu)建可推理的文化傳承關(guān)系網(wǎng)絡(luò),支持大模型生成歷史脈絡(luò)解析與虛擬修復(fù)方案。
2.全域旅游語義交互語料集,覆蓋自然景觀、人文地標(biāo)、民俗活動等場景的多語言指令庫,包含游客意圖識別、多模態(tài)問答邏輯鏈標(biāo)注,適配AR導(dǎo)游、智能客服等生成式應(yīng)用。
3.非物質(zhì)文化遺產(chǎn)語料集,記錄非遺技藝操作流程、傳承人口述史料、工藝演變圖譜,標(biāo)注技藝關(guān)鍵步驟與現(xiàn)代化改良邏輯,用于大模型驅(qū)動的非遺數(shù)字化傳播與創(chuàng)新設(shè)計。
4.上海方言傳承數(shù)據(jù)集,涵蓋上海方言中的流行語和諺語,包含現(xiàn)代年輕人對這些詞匯的解讀與使用,研究方言在當(dāng)代語境下的創(chuàng)新和變遷,包括買菜、乘車、就醫(yī)、餐飲等日常生活場景的上海方言對話,幫助方言適配智能語音助手、AI客服等實際應(yīng)用。
十一、城市治理
1.公共空間行為模式語料集,基于視頻與WiF熱力圖的市民活動軌跡數(shù)據(jù),標(biāo)注聚集密度、行為類型(休閑/通行/商業(yè))及時空分布規(guī)律,用于預(yù)測公共設(shè)施使用負(fù)荷。
2.城市治理決策知識圖譜,融合政策文本、市民訴求的因果關(guān)聯(lián)網(wǎng)絡(luò),標(biāo)注事件處置路徑與多部門協(xié)同規(guī)則,支撐大模型生成決策建議。
3.跨模態(tài)市政設(shè)施狀態(tài)語料集,整合維修工單文本、傳感器異常信號、上報圖片的多模態(tài)對齊數(shù)據(jù),標(biāo)注故障因果鏈與處置優(yōu)先級,訓(xùn)練大模型實現(xiàn)設(shè)施健康度自診斷。
4.城市規(guī)劃設(shè)計語料庫,涵蓋地形地貌、土地利用、、人口分布、交通流量模式、公共設(shè)施服務(wù)半徑、生態(tài)環(huán)境指標(biāo)等信息,并融合歷史規(guī)劃案例、政策法規(guī)庫等非結(jié)構(gòu)化文本。為空間格局優(yōu)化、基礎(chǔ)設(shè)施配置、生態(tài)安全屏障建設(shè)提供量化決策依據(jù)。
05
獎項設(shè)置
各賽道分設(shè)一、二、三等獎,擬以證書、獎金等形式發(fā)放。
一等獎1名,5萬元;
二等獎1名,3萬元;
三等獎2名,1萬元。
06
報名咨詢
賽事咨詢聯(lián)系人:楊女士聯(lián)系電話:郵箱:baibing@bjultra.com點擊文末“閱讀原文”查看更多科創(chuàng)機(jī)會。
大家都在看
智能視覺+航空航天全球大賽項目征集