首頁(yè)|必讀|視頻|專(zhuān)訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車(chē)|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 人工智能 >> 正文

OpenAI 啟動(dòng)先鋒計(jì)劃,旨在重塑 AI 模型評(píng)分體系

2025年4月10日 11:04  IT之家  作 者:遠(yuǎn)洋

OpenAI 宣布啟動(dòng) OpenAI 先鋒計(jì)劃(OpenAI Pioneers Program),致力于改善當(dāng)前 AI 模型的評(píng)分方式。該公司認(rèn)為現(xiàn)有的 AI 基準(zhǔn)測(cè)試存在缺陷,而該計(jì)劃將專(zhuān)注于創(chuàng)建能夠“設(shè)定優(yōu)秀標(biāo)準(zhǔn)”的評(píng)估體系。

隨著 AI 技術(shù)在各行業(yè)的應(yīng)用加速普及,深入了解并提升其在現(xiàn)實(shí)世界中的影響力變得至關(guān)重要。OpenAI 在其博客中指出,創(chuàng)建特定領(lǐng)域的評(píng)估指標(biāo)是更好地反映實(shí)際應(yīng)用場(chǎng)景、幫助團(tuán)隊(duì)在實(shí)際且高風(fēng)險(xiǎn)環(huán)境中評(píng)估模型性能的有效途徑之一。

近期,眾包基準(zhǔn)測(cè)試平臺(tái) LM Arena 與 Meta 的 Maverick 模型引發(fā)的爭(zhēng)議凸顯了一個(gè)問(wèn)題:如今,人們很難明確區(qū)分不同 AI 模型之間的差異。許多廣泛使用的 AI 基準(zhǔn)測(cè)試側(cè)重于衡量模型在一些晦澀任務(wù)上的表現(xiàn),例如解決博士級(jí)別的數(shù)學(xué)難題。還有一些基準(zhǔn)測(cè)試容易被操縱,或者與大多數(shù)人的偏好不一致。

據(jù)IT之家了解,通過(guò)先鋒計(jì)劃,OpenAI 希望為法律、金融、保險(xiǎn)、醫(yī)療保健和會(huì)計(jì)等特定領(lǐng)域創(chuàng)建基準(zhǔn)測(cè)試。該實(shí)驗(yàn)室表示,在未來(lái)幾個(gè)月內(nèi),將與“多家公司”合作設(shè)計(jì)定制化的基準(zhǔn)測(cè)試,并最終將這些基準(zhǔn)測(cè)試公開(kāi),同時(shí)提供“行業(yè)特定”的評(píng)估。

OpenAI 在博客中提到,先鋒計(jì)劃的第一批參與者將專(zhuān)注于初創(chuàng)公司,這些公司將幫助奠定該計(jì)劃的基礎(chǔ)。他們將從眾多初創(chuàng)公司中挑選出少數(shù)幾家,這些公司都在從事高價(jià)值、應(yīng)用廣泛的用例,AI 在其中可以產(chǎn)生實(shí)際影響。

參與該計(jì)劃的公司還將有機(jī)會(huì)與 OpenAI 團(tuán)隊(duì)合作,通過(guò)強(qiáng)化微調(diào)技術(shù)改進(jìn)模型。這種技術(shù)可以針對(duì)一組特定任務(wù)優(yōu)化模型,從而提升其在特定領(lǐng)域的表現(xiàn)。

然而,一個(gè)關(guān)鍵問(wèn)題是 AI 社區(qū)是否會(huì)接受由 OpenAI 資助創(chuàng)建的基準(zhǔn)測(cè)試。此前,OpenAI 曾在財(cái)務(wù)上支持過(guò)基準(zhǔn)測(cè)試工作,并設(shè)計(jì)了自己的評(píng)估方法。但與客戶(hù)合作發(fā)布 AI 測(cè)試可能會(huì)被視為在道德上存在爭(zhēng)議。

編 輯:章芳
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中興通訊董事長(zhǎng)李自學(xué):算力筑基、 AI 啟智,共迎數(shù)智化新紀(jì)元
精彩專(zhuān)題
通信產(chǎn)業(yè)2024年業(yè)績(jī)盤(pán)點(diǎn)
3·15權(quán)益日 | 共筑滿(mǎn)意消費(fèi) 守護(hù)信息通信安全防線
聚焦2025全國(guó)兩會(huì)
2025年世界移動(dòng)通信大會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱(chēng): 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像