日韩少妇无删减的电影在线视频观看-久久久伊人中文字幕-91成人在线视频观看-欧美日韩一区二区三区四区五区-激情五月天网站视频-欧美另类丰满熟妇xx-999re这里只有国产精品-国产蜜臀福利久久久av-人妻中文字幕av精,国产成人精品在线观看视频,69精品人妻久久久久久久,欧美日韩日欧美日韩中

企業(yè)加快智能化轉(zhuǎn)型 大模型“畫龍”小數(shù)據(jù)“點睛”

來源:科技日報

大模型“畫龍”,小數(shù)據(jù)“點睛”

企業(yè)加快智能化轉(zhuǎn)型

◎本報記者 翟冬冬

小數(shù)據(jù)、優(yōu)質(zhì)數(shù)據(jù)應(yīng)用有其前提,即需要在大的基礎(chǔ)模型(預訓練模型)之上,通過小數(shù)據(jù)進行模型的微調(diào),使模型更加精準地服務(wù)具體應(yīng)用場景。從這個角度來講,小數(shù)據(jù)將在未來基礎(chǔ)模型完成下游任務(wù)時,起到關(guān)鍵的作用。

王金橋

中國科學院自動化研究所研究員

如今大數(shù)據(jù)已經(jīng)成為人工智能的“標配”。在訓練人工智能模型的過程中,如果想讓其變得更加聰明,大量的、多樣性的數(shù)據(jù)必不可少。但近日,著名人工智能學者吳恩達在展望人工智能下一個10年的發(fā)展方向時,表達了不同的觀點。他認為,小數(shù)據(jù)、優(yōu)質(zhì)數(shù)據(jù)的應(yīng)用或是未來趨勢。

中國科學院自動化研究所研究員王金橋表示,小數(shù)據(jù)、優(yōu)質(zhì)數(shù)據(jù)應(yīng)用有其前提,即需要在大的基礎(chǔ)模型(預訓練模型)之上,通過小數(shù)據(jù)進行模型的微調(diào),使模型更加精準地服務(wù)具體應(yīng)用場景。從這個角度來講,小數(shù)據(jù)將在未來基礎(chǔ)模型完成下游任務(wù)時,起到關(guān)鍵的作用。

多數(shù)應(yīng)用場景難以獲取高質(zhì)量大數(shù)據(jù)

算法(模型)、算力和數(shù)據(jù)可以說已經(jīng)成為推動人工智能發(fā)展的三大要素,其中數(shù)據(jù)尤為重要。在眾多互聯(lián)消費場景中,我們常常被精準的人工智能推送“擊中”。通過對消費者消費習慣、購物偏好的分析,平臺系統(tǒng)可以對消費者的潛在需求作出判斷并加以引導,而這一切的基礎(chǔ),是基于大量的、豐富的數(shù)據(jù)樣本。利用大數(shù)據(jù),平臺構(gòu)建出了適用于該領(lǐng)域的專用模型,實現(xiàn)精準推送。

這些體驗或許是普通消費者對于大數(shù)據(jù)和人工智能最直接的印象之一。吳恩達在采訪中也表示,在過去10年里,面向消費者的企業(yè)由于擁有大量用戶群(有時甚至高達數(shù)十億),因此獲得了非常大的數(shù)據(jù)集使得人工智能可以開展深度學習,并給企業(yè)帶來了不少經(jīng)濟效益。但他同時強調(diào),這種法則并不適用于其他行業(yè)。其原因在于,并不是所有場景都能產(chǎn)生豐富的大數(shù)據(jù)樣本。

實際上,“在生活中,百分之八九十場景的問題都屬于小樣本問題?!蓖踅饦虮硎?,很多應(yīng)用場景中,由于訓練樣本難以獲取,因此只有極少量數(shù)據(jù),缺陷檢測就是其中的典型案例。缺陷檢測,即采用機器視覺技術(shù)等,對某種特定缺陷進行檢測和識別。這種檢測在航天航空、鐵路交通、智能汽車等眾多領(lǐng)域都有應(yīng)用。由于在實際的生產(chǎn)生活中,存在瑕疵的產(chǎn)品總是少數(shù),所以缺陷檢測的訓練樣本數(shù)量很少。

而即使對于樣本豐富的場景,也存在訓練數(shù)據(jù)標注愈發(fā)困難的問題。王金橋介紹,目前人工智能所使用的訓練數(shù)據(jù),還是以人工標注為主,而在海量數(shù)據(jù)面前,人工標注往往需要行業(yè)經(jīng)驗,一般人難以對標注區(qū)域進行識別。此外,針對每個應(yīng)用需求都需要人工智能專家設(shè)計算法模型,模型越多,開發(fā)成本也會持續(xù)增加。

吳恩達也表示,在消費互聯(lián)網(wǎng)行業(yè)中,我們只需訓練少數(shù)機器學習模型就能服務(wù)10億用戶。然而在制造業(yè)中,有1萬家制造商就要搭建1萬個定制模型。而且要做到這點往往需要大量的人工智能專家。

從目前的行業(yè)發(fā)展趨勢來看,基礎(chǔ)模型或許是解決上述問題的一個方向。

以基礎(chǔ)模型為“基座”用小數(shù)據(jù)微調(diào)

“近些年,行業(yè)開始重視研發(fā)基礎(chǔ)模型或者說是通用型模型來解決上述問題?!蓖踅饦蛘f,先用大量數(shù)據(jù)預訓練一個模型。這些模型在預訓練中,見多識廣是首要任務(wù)。訓練中,模型會見識到該領(lǐng)域各式各樣的數(shù)據(jù),增長見識,以應(yīng)對今后出現(xiàn)的各種情況。之后再在下游任務(wù)中利用具體的場景數(shù)據(jù)進行微調(diào)。

如自然語言處理(NLP)領(lǐng)域的大模型,如果要利用它完成如對話、問答等下游任務(wù),只需要使用這個下游任務(wù)中數(shù)量很小的數(shù)據(jù),在這個大模型之上進行微調(diào),就能達到不錯的效果。一些研究成果也表明,只需要原來建立專屬模型5%—10%的數(shù)據(jù)樣本用于大模型的數(shù)據(jù)微調(diào),就能得到和專屬模型一樣的精度。

“從大模型轉(zhuǎn)向小模型,實現(xiàn)一個模型做多個任務(wù),可以說是目前行業(yè)發(fā)展中的一個轉(zhuǎn)變。”王金橋說,這樣不僅降低了開發(fā)難度,還大大減少了開發(fā)成本。以前,每個算法都需要一個深度學習專家去設(shè)計和訓練,現(xiàn)在只需要在大模型之下進行微調(diào),模型的設(shè)計和架構(gòu)也變得相對簡單。中小型企業(yè)只需要在大模型上,自己上傳數(shù)據(jù)就可以完成。

此外,利用這種方法,模型的誤報率也會減少?;A(chǔ)模型見過豐富多彩的數(shù)據(jù)和場景,在處理具體任務(wù)的時候就具備了海量知識儲備,有更充足的準備去應(yīng)對具體的小場景應(yīng)用。

不過吳恩達在訪談中也表示,預訓練只是要解決難題的一小部分,更大的難題是提供一個工具讓使用者能夠選擇正確的數(shù)據(jù)用于微調(diào),并用一致的方式對數(shù)據(jù)進行標記。面對大數(shù)據(jù)集的應(yīng)用時,開發(fā)者的通常反應(yīng)都是如果數(shù)據(jù)有噪音也沒關(guān)系,所有數(shù)據(jù)照單全收,算法會對其進行平均。但是,如果研究人員能夠開發(fā)出用來標記出數(shù)據(jù)不一致地方的工具,為使用者提供一種非常有針對性的方法來提高數(shù)據(jù)質(zhì)量,那這將是獲得高性能系統(tǒng)的更有效的方法。

多模態(tài)或是大模型未來發(fā)展方向

基礎(chǔ)模型作為生產(chǎn)眾多小模型的“基座”,性能尤為重要。其認知能力越接近人類,在此之上產(chǎn)生的小模型性能也將越優(yōu)異。

在探索外部環(huán)境的時候,人類具備視覺、聽覺、觸覺等多種認知手段,并通過語言對話等形式實現(xiàn)互動交流。其中視覺得到的信息約占70%,聽覺、觸覺等獲得的信息約占30%?!巴瑯?,要使得大模型的性能更加優(yōu)秀,更趨近人類的認知能力,就涉及到訓練中的數(shù)據(jù)融合問題。”王金橋指出,我們熟知的語言生成模型GPT-3,能夠生成流暢自然的文本,并完成問答、翻譯、創(chuàng)作小說等一系列NLP任務(wù),甚至可以進行簡單的算術(shù)運算。但其和外界交互的主要方式還是進行文本交流,缺乏圖像、視頻等多模態(tài)融合。

每一種信息的來源或者形式,都可以稱為一種模態(tài)。如人有觸覺、聽覺、視覺、嗅覺;信息的媒介有語音、視頻、文字等。人的認知模型可以說是一個多模態(tài)的集合。

要讓基礎(chǔ)模型的預訓練更接近人類的認知模型,也需要進行多模態(tài)融合。即讓模型通過機器學習的方法實現(xiàn)處理和理解多源模態(tài)信息的能力,如圖像、視頻、音頻、語義之間的多模態(tài)學習。多模態(tài)預訓練模型被廣泛認為是從限定領(lǐng)域的弱人工智能邁向通用人工智能路徑的探索。

“這一兩年,大模型的數(shù)量呈現(xiàn)爆發(fā)式增長,且有從單一模態(tài)模型轉(zhuǎn)向多模態(tài)模型的趨勢。”王金橋說,具備了多模態(tài)能力的基礎(chǔ)模型,在具體應(yīng)用場景中健壯性更好,在異常和危險情況下系統(tǒng)的生存能力更強,今后多模態(tài)基礎(chǔ)模型或?qū)⒊蔀槲磥砘A(chǔ)模型發(fā)展的一個重要方向。

標簽:

推薦

財富更多》

動態(tài)更多》

熱點

国产睡熟迷奷系列精品-免费国产看黄网站一级-草草草逼网-按摩引诱良妇半推半就电影 | 色狠久久AV北条麻妃081-国产干逼逼-美女一区二区avHH-花野真衣無碼中出AV | 极品人妻猎交桥-黑人男优在线-av免费网站在线观看-ヘンリー冢本日本熟妇 | DVD原版日韩成人在线 FREE性满足HD-麻豆蜜桃臀极品少妇-97电影院老女-xxxxx黄色 | 国产第一夜-游泳教练巨大粗长挺进体内-三级古装片亚洲国产精品久久久久性色-www,001超薄在线观看 | BD韩语在线观看完整版 日韩精品无码一区二区三区久久久-黄片爽歪-国产在线精品一区二区三区-中日韩三级黄色自拍片 | 狠狠色狠狠色综合久久-中国妇女扒B自慰-DVD在线观看视频 扒开老师的小泬喷白浆网站-精品久久国产老人久久综合 | 爆操小仙女-欧美明星久久久A-台湾佬中文字幕在线中文字幕-中文字幕在线视频伊人二区青青天堂 | 九色蝌蚪黄网-久操视屏-校园教师叉逼视频流白浆-擦B老熟女AV | 国产剧高清完整版播放 提供优质观影体验下载服务-紧缚人妻の乱绳地狱-大香蕉伊人影院-日韩去干网 | 欧美国产-丰满少妇在线观看网站-很很干,网站-免费a级毛片无码樱桃视频 | 国产又粗又黄又爽又硬P站-日韩在线 np-欧美日韩淫荡女人-3B肉蒲团之四虎影库之嫩嫩草 | 午夜福利高清精品久久-就去吻亚洲-两口子交换真实刺激高潮-日韩美女爱爱视频 | 人伦片无码中文字幕-国产中文99视频在线观看-男男Gay叫床啪啪无码-国产剧日韩免费观看 精品国产原创超清无码网站 | 91色情网老熟女-五级A片-女子业余国产-亚州又大又粗 | 色婷婷国产亚洲精品色窝窝-伦理导航凹凸-哆啪啪在线视频-日韩黄色A片熟女 | 亚州怡红院-亚州精品在线播放视频-内射白嫩少妇-欧美性猛交xxxx乱大交3 | 爽妇导航-北条麻妃潮喷-BD英语高清在线 亚洲天堂视频在线观看-自拍偷拍视频网址 | 狠狠干老师-日本学生和黑人XXXX-破处永久页-极品粉嫩午夜福利视频 | 少妇搡BBBB搡BBB搡AA-好想被cao求cao随便cao视频-少妇自摸视频网站在线观看-波多野结衣中文字幕2019 | 九月婷婷成人社区-少妇太紧太爽又黄又硬-国产Aa情色性爱-成人免费在线裸之大陆| 人妻办公室屈辱呻吟中文字幕-搡BBBB搡BBB搡我瞎了-免费观看黄网站-后入91 | 无码一区二区波多野结衣播放搜索-日韩台性色av-狠狠插少妇视频-午夜偷拍 | 一道本日本欧美草草-免费观看国产不卡福利-有字幕完整版 国产熟妇无码A片AAA毛片视频-男人日女人人人网毛片 | 中文日韩黑人-熟女之伦11p-草莓视频在线观看黄色-又硬又粗进去好爽A片青楼传媒 | 亚日韩在线观看片免费人成视频-亚洲国产综合人成综合网站00-日无码一区二区-国产变态深喉囗交AV 欧美性大战久久久久久的安居码-大奶子婷婷-4k日本电影免费 亚洲精品无码久久毛-欧美亚在线视频 | 北条麻妃精品无套内谢-色综久久 后入在线观看 四虎影库在线播放-国产成人午夜无码-美女大黄片 | 鸡巴插入小穴视频在线观看-三年片免费观看大全有-爱爱视频日韩-四川BBB搡BBB爽爽爽电影 | 亚洲在线影库-天天插天天狠天天透-jizz中国视频-港澳日美AV | 国产AV一级闺蜜-ww无码-李丽莎久久网站-四川少妇BBB操BBB | 四川BBBB搡BBB搡B1-无码不卡中文字幕一区二区三区-蓝光在线播放观看 久久亚洲视频-婴交从小就做H高 | 特殊学院淫play高H-1级妇女录像-明星换脸一区二区赵丽颖-尻干妹子去干网 | 丝袜黄毛片-久久亚洲精品小早川怜子-中字幕一区-免费片子无毛 | 五指姑娘影视-麻豆精品久久精品色综合-成全视频面成全视频免费看-老少伦一区二区三区 | 一本热久-c逼好爽-国产丰满乱子伦无码专区-中国美女新婚之夜高潮 | 亚洲第九页夜-(高H,高c)开荤黑人-亚洲女同色情-五十路老熟道中出在线播放 | BD迅雷电影在线 菠萝菠萝蜜视频免费1-免费看大美女大奶子裸体的网站-欧美一区二区三区视频-国产亲子乱婬一级A片 | 女人自慰一级无遮挡毛片-jzzjzz大片免费观看-超碰在线25-狠狠操社区 | 久久噜嚕嚕-黑丝自慰在线观看-熟女人妻撅着屁股耸动-世界黑人女优激情按摩女人体 | 小鲜肉性生活A级影片-亚洲第七色爱-国产理伦-日本女同视频 | 贱骚扇B主人调教视频-亚洲 欧美 自拍 动漫 另类 中文字幕在线字幕-国产yin乱大巴magnet-女学生睡熟迷奷 |