国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當前位置:首頁 > 科技  > 網絡

數據標注員什么時候會被AI替代?谷歌:現在就行

來源: 責編: 時間:2023-09-11 22:31:26 417觀看
導讀 似乎自ChatGPT進入大眾視野起,需要依靠人工進行數據標注,就成為人們對大語言模型(LLM)根深蒂固的印象之一。從兩個以上大模型針對同一個問題給出的不同回答里,找到當中的語病、邏輯和事實錯誤,標記不同的錯誤類型

似乎自ChatGPT進入大眾視野起,需要依靠人工進行數據標注,就成為人們對大語言模型(LLM)根深蒂固的印象之一。MeE28資訊網——每日最新資訊28at.com

從兩個以上大模型針對同一個問題給出的不同回答里,找到當中的語病、邏輯和事實錯誤,標記不同的錯誤類型,再對這些回答按照質量分別進行打分等,這些都是大模型數據標注員要干的事情。MeE28資訊網——每日最新資訊28at.com

這個過程被叫做RLHF(Reinforcement Learning from Human Feedback),即基于人類反饋的強化學習。RLHF也是被ChatGPT、Bard和LLaMA等新興大模型帶火的模型訓練方法,它大的好處就在于能夠將模型和人類的偏好對齊,讓大模型給出更符合人類表達習慣的回答。MeE28資訊網——每日最新資訊28at.com

不過近發布在arXiv的一份論文表明,這份看起來只有人類能做的工作,也能被AI取代!MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

AI也取代了RLHF中的“H”,誕生了一種叫做“RLAIF”的訓練方法。MeE28資訊網——每日最新資訊28at.com

這份由谷歌研究團隊發布的論文顯示,RLAIF能夠在不依賴數據標注員的情況下,表現出能夠與RLHF相媲美的訓練結果——MeE28資訊網——每日最新資訊28at.com

如果拿傳統的監督微調(SFT)訓練方法作為基線比較,比起SFT,1200個真人“評委”對RLHF和RLAIF給出答案的滿意度都超過了70%(兩者差距只有2%);另外,如果只比較RLHF和RLAIF給出的答案,真人評委們對兩者的滿意度也是對半分。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

這里的“勝率”體現了文中的“滿意度”MeE28資訊網——每日最新資訊28at.com

需要說明的是,谷歌的這篇論文也是第一個證明了RLAIF在某些任務上能夠產生與RLHF相當的訓練效果的研究。MeE28資訊網——每日最新資訊28at.com

早提出讓AI反饋代替人類反饋用于強化學習訓練的研究,是來自2022年Bai et al. 發布的一篇論文。這篇論文也首次提出了RLAIF的概念,并發現了AI標注的“天賦”,不過研究者在當時還并沒有將人類反饋和AI反饋結果進行直接比較。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

總之谷歌的這一研究成果一旦被更多人接受,將意味著不用人類指點,AI也能訓練自己的同類了。MeE28資訊網——每日最新資訊28at.com

下面可以來看看RLAIF具體是怎么做的。MeE28資訊網——每日最新資訊28at.com

我們知道,RLHF的方法大致可以分為三個步驟:預訓練一個監督微調LLM,收集數據訓練一個獎勵模型(RM),以及用強化學習(RL)方式微調模型。MeE28資訊網——每日最新資訊28at.com

從論文給出的圖示看,AI和人類標注員發揮作用的環節,主要是在訓練獎勵模型(RM)并生成反饋內容這里。你可以把“獎勵”理解為,讓人/AI來告訴模型哪種回答更好,答得更好就能有更多獎勵(所以也能理解人工標注存在的必要)。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

接著研究人員主要就“根據一段文字生成摘要”這一任務,展示了RLAIF的標記方法。MeE28資訊網——每日最新資訊28at.com

下面的表格比較完整地展示了RLAIF方法的輸入結構:MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

首先是序言(Preamble),用來介紹和描述手頭任務的說明。比如描述說,好的摘要是一段較短的文字,具有原文的精髓…給定一段文本和兩個可能的摘要,輸出1或2來指示哪個摘要符合上述定義的連貫性、準確性、覆蓋范圍和整體質量。MeE28資訊網——每日最新資訊28at.com

其次是樣本示例(1-Shot Exemplar)。比如給到一段“我們曾是超過四年的好朋友……”的文本,接著給到兩個摘要,以及“摘要1更好”的偏好判斷,讓AI學著這個示例對接下來的樣本做標注。MeE28資訊網——每日最新資訊28at.com

再者就是給出所要標注的樣本(Sample to Annotate),包括一段文本和一對需要標記的摘要。MeE28資訊網——每日最新資訊28at.com

后是結尾,用于提示模型的結束字符串。MeE28資訊網——每日最新資訊28at.com

論文介紹到,為了讓RLAIF方法中AI標注更準確,研究者也加入了其他方法以獲取更好的回答。譬如為了避免隨機性問題,會進行多次選擇,其間還會對選項的順序進行交換;此外還用到了思維鏈(CoT)推理,來進一步提升與人類偏好的對齊程度。MeE28資訊網——每日最新資訊28at.com

從原始prompt到輸出的完整流程如下圖所示:MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

能看到,就像人類標注員會給不同的回答打分一樣(比如滿分5分),AI也會依據偏好給每個摘要打分,相加起來是1分。所以這個分數就可以理解為上文提到的獎勵。MeE28資訊網——每日最新資訊28at.com

以上就是RLAIF方法大致會經歷的過程。MeE28資訊網——每日最新資訊28at.com

而在評價RLAIF方法的訓練結果到底好不好時,研究人員使用了三個評估指標,分別是AI標簽對齊度(AI Labeler Alignment)、配對準確度(Pairwise Accuracy)和勝率(Win Rate)。MeE28資訊網——每日最新資訊28at.com

簡單理解三個指標,AI標簽對齊度指的就是AI偏好相對于人類偏好的精確程度,配對準確度指訓練好的獎勵模型與人類偏好數據集的匹配程度,勝率則是人類在RLAIF和RLHF生成結果之間的傾向性。MeE28資訊網——每日最新資訊28at.com

研究人員在依據評估指標進行了繁雜的計算之后,終得出了RLAIF和RLHF“打平手”的結論。MeE28資訊網——每日最新資訊28at.com

當然也有一些非量化的定性分析。譬如研究發現,RLAIF似乎比RLHF更不容易出現“幻覺”,下表所示幾個例子中標紅部分便是RLHF的幻覺,盡管看上去是合理的:MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

而在另一些例子里,RLAIF的語法表現似乎又比RLHF差不少(標紅為RLAIF的語法問題):MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

盡管如此,RLAIF和RLHF整體來說生成高質量摘要的能力還是旗鼓相當的。MeE28資訊網——每日最新資訊28at.com

該論文的發布很快收獲了不少關注。比如有從業者評論道,等到GPT-5可能就不需要人類數據標注員了。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

也有網友貼圖打趣,用AI來訓練同類的做法就好比是這張梗圖。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

不過針對谷歌這篇論文中用到的研究方法,身為著名軟件工程師、AI專家的Evan Saravia也認為,研究人員只在論文中分析了RLAIF和RLHF在“生成摘要”這一任務上的表現,其他更加泛化的任務表現如何還有待觀察。MeE28資訊網——每日最新資訊28at.com

此外,研究人員也沒有將人工標注和使用AI成本的因素考慮在內。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

其實以上網友預測未來的大模型將不再需要人類標注員,也側面體現出目前RLHF方法因為過于依賴人工而遇到的瓶頸:大規模高質量的人類標注數據可能會非常難以獲取——MeE28資訊網——每日最新資訊28at.com

大模型數據標注員往往是流動性非常高的工種,并且由于數據標注很多時候非常依賴標注員的主觀偏好,也就更加考驗標注員的自身素質。MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com

短期內也許會像這位從業者說的,“我不會說這(RLAIF)降低了人工標注的重要性,但有一點可以肯定,人工智能反饋的RL可以降低成本。人工標注對于泛化仍然極其重要,而RLHF+RLAIF混合方法比任何單一方法都要好。”MeE28資訊網——每日最新資訊28at.com

數據標注員什么時候會被AI替代?谷歌:現在就行MeE28資訊網——每日最新資訊28at.com


文章出處:品玩網

本文鏈接:http://m.rrqrq.com/showinfo-17-9219-0.html數據標注員什么時候會被AI替代?谷歌:現在就行

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 網約車老師傅們的“反擊”

下一篇: 搶“.AI”域名 成了3000萬美元的大生意

標簽:
  • 熱門焦點
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
国产女同互慰高潮91漫画| 日欧美一区二区| 欧美精品一区二区三区在线| 欧美久久免费观看| 欧美色电影在线| 欧美日韩精品福利| 欧美喷潮久久久xxxxx| 欧美日韩国产在线观看| 56国语精品自产拍在线观看| 在线不卡欧美精品一区二区三区| 欧美日韩二区三区| 日韩免费观看2025年上映的电影 | 久久久综合网| 久久久久久久欧美精品| 欧洲精品中文字幕| 911精品产国品一二三产区| 欧美一级高清片在线观看| 久久青草国产手机看片福利盒子 | 蜜桃av一区二区三区| 国产一区二区精品在线观看| 国产精品99久| 欧美高清一区二区| 亚洲每日在线| 色香色香欲天天天影视综合网| 欧美日韩一级黄| 久久久久久久综合色一本| 亚洲色图在线视频| 日本成人中文字幕| 成人性生交大片免费看中文网站| 午夜日韩av| 久久久久久亚洲精品杨幂换脸| 欧美日韩国产片| 国产日韩欧美高清| 性欧美疯狂xxxxbbbb| 国产精品一区在线| 黄色成人91| 欧美日韩日日骚| 国产精品久久网站| 免费看黄色91| 午夜精品网站| 91九色02白丝porn| 久久久久久亚洲综合影院红桃| 亚洲黄色录像片| 国产91色综合久久免费分享| 激情综合电影网| 9191国产精品| 一区二区三区久久久| 丰满少妇在线播放bd日韩电影| 91久久综合| 欧美mv日韩mv国产网站app| 亚洲啪啪综合av一区二区三区| 国产裸体歌舞团一区二区| 亚洲高清在线观看一区| 69久久99精品久久久久婷婷| 一区二区三区四区中文字幕| 粉嫩一区二区三区在线看| 国产情侣一区| 国产婷婷色一区二区三区四区| 午夜欧美一区二区三区在线播放| 97超碰欧美中文字幕| 欧美亚洲丝袜传媒另类| 日韩理论片一区二区| 久久青青草原一区二区| 日本欧美一区二区在线观看| 婷婷国产v国产偷v亚洲高清| 成人教育av在线| 久久在线精品| 国产精品免费视频观看| 高清久久久久久| 日本韩国视频一区二区| 日韩伦理免费电影| jizzjizzjizz欧美| 5858s免费视频成人| 免费不卡在线视频| 国产欧美日韩在线播放 | 亚洲女同女同女同女同女同69| 国产精品99久久久久久宅男| 在线这里只有精品| 一区二区三区高清在线| 欧美激情1区2区| 日韩一级片在线播放| 裸体在线国模精品偷拍| 性色一区二区三区| 亚洲欧美视频在线观看视频| 午夜精品视频| 久久一区二区三区四区| 国产成人高清在线| 欧美日韩高清在线播放| 久久99精品网久久| 欧美色综合网站| 久久精品免费观看| 在线免费不卡电影| 免费观看91视频大全| 久久精品一区二区国产| 亚洲综合一区二区| 国产亚洲一级| 亚洲一区二区三区中文字幕| 一区二区三区三区在线| 1024亚洲合集| 一区二区三区四区五区精品| 亚洲欧美一区二区久久| 亚洲黄色影片| 亚洲伊人伊色伊影伊综合网| 亚洲一区在线直播| 亚欧色一区w666天堂| 久久国产精品高清| 日韩高清不卡一区二区三区| 欧美伊人久久久久久久久影院| 美女在线视频一区| 欧美男生操女生| 国产不卡视频在线观看| 久久亚洲影视婷婷| 好吊色欧美一区二区三区视频| 国产精品不卡在线观看| 99国产精品久久久久久久成人热| 亚洲乱码国产乱码精品精98午夜| 国产一区二区三区奇米久涩| 图片区小说区国产精品视频| 欧美日韩中文一区| 成人av中文字幕| 国产精品理论在线观看| 小嫩嫩精品导航| 国产乱子伦视频一区二区三区 | 国产成人av影院| 久久精品视频在线看| 亚洲日本无吗高清不卡| 日本亚洲视频在线| 91精品国产91热久久久做人人| 欧美一区免费视频| 午夜精品福利一区二区三区蜜桃| 欧美日韩国产a| 欧美成人日本| 亚洲福利视频导航| 欧美一区二区三区精品| 欧美日一区二区在线观看 | 久久国产生活片100| 精品日韩99亚洲| 亚洲精品日韩久久| 狠狠色丁香婷婷综合| 中文字幕av资源一区| 久久亚洲午夜电影| 成人app网站| 亚洲成a人v欧美综合天堂下载 | 久久国产夜色精品鲁鲁99| 精品成人私密视频| 久久精品官网| 91在线一区二区| 午夜精品影院在线观看| 欧美精品一区二区三区四区| 国产精品免费区二区三区观看| 国产在线精品国自产拍免费| 中文字幕亚洲视频| 91精品国产91热久久久做人人| 在线观看亚洲| 成人美女视频在线观看| 亚洲风情在线资源站| 久久久久高清精品| 欧美主播一区二区三区| 亚洲精品国产日韩| 懂色av一区二区三区免费观看| 亚洲国产一区视频| 久久人人97超碰com| 欧美日韩国产精选| 国产美女诱惑一区二区| 欧美在线国产| 国产成人免费在线视频| 亚洲超碰精品一区二区| 国产精品久久久久久久浪潮网站| 91精品国产综合久久精品 | 午夜精品久久久久久久久| 国产日本一区二区| 69精品人人人人| 91福利视频久久久久| 99精品国产99久久久久久福利| 成人精品高清在线| 韩国三级中文字幕hd久久精品| 亚洲午夜免费视频| 国产精品成人一区二区三区夜夜夜| 欧美大片在线观看一区| 欧美日韩中文字幕一区二区| 新67194成人永久网站| 日韩视频三区| 影音先锋久久资源网| 欧美人与禽猛交乱配| 白白色 亚洲乱淫| 大胆欧美人体老妇| 国产一区二区视频在线播放| 麻豆国产精品一区二区三区| 午夜婷婷国产麻豆精品| 亚洲一区二区三区影院| 综合电影一区二区三区 | 国产精品国产三级国产普通话蜜臀 | 国产在线视频精品一区| 久88久久88久久久| 久久电影网电视剧免费观看| 蜜桃av一区二区| 久久99热国产| 九一久久久久久| 国产精品自拍三区| 国产精品一区三区|