国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當(dāng)前位置:首頁 > 科技  > 軟件

淺析數(shù)據(jù)工程

來源: 責(zé)編: 時(shí)間:2023-08-09 23:04:02 411觀看
導(dǎo)讀目前數(shù)字化轉(zhuǎn)型對(duì)于市場(chǎng)來說并不是一個(gè)新鮮事物,從技術(shù)視角來看,盡管大模型的涌現(xiàn)帶來人們的更多關(guān)注,但人工智能與大數(shù)據(jù)相關(guān)技術(shù)仍處于創(chuàng)新階段,各行業(yè)正在尋找和探索價(jià)值場(chǎng)景與新興技術(shù)融合的平衡點(diǎn),希望在新興技術(shù)的加

目前數(shù)字化轉(zhuǎn)型對(duì)于市場(chǎng)來說并不是一個(gè)新鮮事物,從技術(shù)視角來看,盡管大模型的涌現(xiàn)帶來人們的更多關(guān)注,但人工智能與大數(shù)據(jù)相關(guān)技術(shù)仍處于創(chuàng)新階段,各行業(yè)正在尋找和探索價(jià)值場(chǎng)景與新興技術(shù)融合的平衡點(diǎn),希望在新興技術(shù)的加持下能夠在激烈的競(jìng)爭(zhēng)中占據(jù)有利位置。SG328資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù),數(shù)據(jù)

數(shù)據(jù)是新一代技術(shù)革命下的生產(chǎn)要素,掌握了生產(chǎn)要素與生產(chǎn)要素的加工方式就是掌握了數(shù)字經(jīng)濟(jì)下的價(jià)值密碼,這已經(jīng)是業(yè)界的基本共識(shí)。SG328資訊網(wǎng)——每日最新資訊28at.com

企業(yè)想要更好地管理數(shù)據(jù)并利用數(shù)據(jù),就必須了解數(shù)據(jù)在現(xiàn)代企業(yè)中的產(chǎn)生源頭、組織形態(tài)等。企業(yè)數(shù)字化轉(zhuǎn)型一般分為三個(gè)階段:SG328資訊網(wǎng)——每日最新資訊28at.com

圖片圖片SG328資訊網(wǎng)——每日最新資訊28at.com

從數(shù)據(jù)產(chǎn)生到數(shù)據(jù)價(jià)值落地的過程中,數(shù)據(jù)的信息密度越來越高,其中蘊(yùn)含的知識(shí)也越來越豐富。通過分析企業(yè)數(shù)據(jù)全流程,企業(yè)可以抓住重點(diǎn)環(huán)節(jié),因地制宜制定落地規(guī)劃,數(shù)據(jù) 全流程分析是每個(gè)企業(yè)在進(jìn)行數(shù)據(jù)工程落地的前提。SG328資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)工程

從軟件開發(fā)出現(xiàn)到軟件開發(fā)逐步規(guī)模化的過程中, IT 從業(yè)者 們一點(diǎn)點(diǎn)積累下關(guān)于需求、設(shè)計(jì)、實(shí)現(xiàn)、測(cè)試、運(yùn)維等方面的工作最佳實(shí)踐。數(shù)據(jù)在企業(yè)內(nèi)部流轉(zhuǎn)會(huì)經(jīng)歷多個(gè)階段,而每個(gè)階段之間還存在著各種各樣的問題。SG328資訊網(wǎng)——每日最新資訊28at.com

圖片圖片SG328資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)工程則是幫助企業(yè)高效地挖掘數(shù)據(jù)價(jià)值,持續(xù)地賦能業(yè)務(wù)增長, 加速數(shù)據(jù)到資產(chǎn)的升華過程的最佳實(shí)踐。SG328資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)工程包含了需求、設(shè)計(jì)、構(gòu)建、測(cè)試、維護(hù)演進(jìn)等階段,涵蓋了項(xiàng)目管理、開發(fā)過程管理、工程工具與方 法、構(gòu)建管理、質(zhì)量管理, 是一套為了應(yīng)對(duì)規(guī)模化生產(chǎn)和使用數(shù)據(jù)、為業(yè)務(wù)提供數(shù)據(jù)支撐, 最終產(chǎn)生價(jià)值的體系。SG328資訊網(wǎng)——每日最新資訊28at.com

  • 數(shù)據(jù)工程是一套體系
  • 數(shù)據(jù)工程是用來加速數(shù)據(jù)到價(jià)值過程的規(guī)模化最佳實(shí)踐
  • 數(shù)據(jù)工程是軟件工程的一部分
  • 數(shù)據(jù)工程不是傳統(tǒng)軟件工程在數(shù)據(jù)領(lǐng)域的簡單重現(xiàn)

對(duì)于企業(yè)來說,數(shù)據(jù)工程包括三個(gè)戰(zhàn)略環(huán)節(jié):數(shù)據(jù)愿景對(duì)齊、數(shù)據(jù)工程落地實(shí)施、數(shù)據(jù)持續(xù)運(yùn)營。SG328資訊網(wǎng)——每日最新資訊28at.com

圖片圖片SG328資訊網(wǎng)——每日最新資訊28at.com

愿景對(duì)齊的第一步是通過定義、統(tǒng)一業(yè)務(wù)價(jià)值度量框架來識(shí)別業(yè)務(wù)價(jià)值場(chǎng)景。探索出的業(yè)務(wù)價(jià)值場(chǎng)景需要包含場(chǎng)景的背景、價(jià)值點(diǎn)、 所涉及的用戶、需要什么樣的能力、用戶旅程、所涉及的實(shí)體、風(fēng)險(xiǎn)等信息。SG328資訊網(wǎng)——每日最新資訊28at.com

落地過程就如同孕育新生命一般,其中數(shù)據(jù)梳理規(guī) 劃藍(lán)圖,數(shù)據(jù)架構(gòu)設(shè)計(jì)規(guī)劃骨架,數(shù)據(jù)模型設(shè)計(jì)構(gòu)成器官,數(shù)據(jù)接入則賦予信息感知能力,數(shù)據(jù)處理構(gòu)成中樞 大腦, 測(cè)試、安全部分負(fù)責(zé)為新生兒提供保護(hù), 每個(gè)步驟相互依賴, 缺一不可,通過數(shù)據(jù)梳理、數(shù)據(jù)架構(gòu)設(shè)計(jì)、數(shù)據(jù)接入、數(shù)據(jù)處理、數(shù)據(jù)測(cè)試、數(shù)據(jù)安全和能力復(fù)用與保障七個(gè)步驟來實(shí)現(xiàn)數(shù)據(jù)工程落地。SG328資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)運(yùn)營的目的是要形成企業(yè)看數(shù)據(jù)、用數(shù)據(jù)、將數(shù)據(jù)作為溝通語言和工具的“數(shù) 據(jù)文化”,數(shù)據(jù)只有容易被發(fā)現(xiàn),才有產(chǎn)生價(jià)值的可能性。SG328資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)工程人員的能力模型

數(shù)據(jù)工程的落地,歸根結(jié)底還是需要由人來完成。構(gòu)建企業(yè)自身的人員能力培養(yǎng)機(jī)制、 搭建企業(yè)人員數(shù)據(jù)能力提升通道是數(shù)據(jù)工程能力持續(xù)迭代的重要保障。SG328資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)工程師能力模型如下:SG328資訊網(wǎng)——每日最新資訊28at.com

圖片圖片SG328資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)產(chǎn)品經(jīng)理的能力模型如下:SG328資訊網(wǎng)——每日最新資訊28at.com

圖片圖片SG328資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)分析師的能力模型如下:SG328資訊網(wǎng)——每日最新資訊28at.com

圖片圖片SG328資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)工程是數(shù)字經(jīng)濟(jì)下確保數(shù)據(jù)價(jià)值轉(zhuǎn)化的重要保障,是加速數(shù)據(jù)轉(zhuǎn)化為價(jià)值的重要手段,需要應(yīng)對(duì)未來數(shù)字經(jīng)濟(jì)的大趨勢(shì)。為了處理數(shù)據(jù)領(lǐng)域的各種新問題, 各種新技術(shù)、新概念逐漸涌現(xiàn), 現(xiàn)代數(shù)據(jù)倉庫、數(shù)據(jù)湖、湖倉一體、分布式數(shù)據(jù)架構(gòu)、機(jī)器學(xué)習(xí)、數(shù)據(jù)云原生等逐一登上舞臺(tái)。SG328資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)工程的工具圖譜

數(shù)據(jù)工程是咨詢公司Thoughtworks 給出的概念, 但仍然是新瓶裝舊酒, 個(gè)人可以認(rèn)為,可以映射成傳統(tǒng)意義上的數(shù)據(jù)治理。對(duì)于數(shù)據(jù)治理而言,已經(jīng)有相對(duì)成熟的體系, 下面是數(shù)據(jù)治理的工具全景圖:SG328資訊網(wǎng)——每日最新資訊28at.com

圖片圖片SG328資訊網(wǎng)——每日最新資訊28at.com

特別地, 對(duì)AI計(jì)算的能力支撐工具圖譜而言,如下圖所示:SG328資訊網(wǎng)——每日最新資訊28at.com

圖片圖片SG328資訊網(wǎng)——每日最新資訊28at.com

大模型與數(shù)據(jù)工程

人工智能發(fā)展的突破得益于高質(zhì)量數(shù)據(jù)的發(fā)展,數(shù)據(jù)是大模型競(jìng)爭(zhēng)的關(guān)鍵要素之一,大模型的訓(xùn)練需要高質(zhì)量、大規(guī)模、多樣性的數(shù)據(jù)集,而優(yōu)質(zhì)中文數(shù)據(jù)集是稀缺的。行業(yè)數(shù)據(jù)的價(jià)值很高,具有優(yōu)質(zhì)數(shù)據(jù)和一定大模型能力的公司或通過行業(yè)大模型賦能業(yè)務(wù)。SG328資訊網(wǎng)——每日最新資訊28at.com

未來數(shù)據(jù)成本在大模型開發(fā)中的成本占比或?qū)⑻嵘饕〝?shù)據(jù)采集, 清洗, 標(biāo)注等成本。在模型相對(duì)固定的前提下,通過提升數(shù)據(jù)的質(zhì)量和數(shù)量可以提升整個(gè)模型的訓(xùn)練效果。以數(shù)據(jù)為中心的AI工作流如下圖所示:SG328資訊網(wǎng)——每日最新資訊28at.com

圖片圖片SG328資訊網(wǎng)——每日最新資訊28at.com

從 GPT- 1 到 LLaMA 的大語言模型數(shù)據(jù)集主要包含六類:維基百科、書籍、期刊、Reddit 鏈接、 Common Crawl 和其他數(shù)據(jù)集。多模態(tài)大模型需要更深層次的網(wǎng)絡(luò)和更大的數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練。過 去數(shù)年中, 多模態(tài)大模性參數(shù)量及數(shù)據(jù)量持續(xù)提升。例如, 2022 年 Stability AI 發(fā)布的 Stable Diffusion 數(shù)據(jù)集包含 58.4 億圖文對(duì)/圖像,是 2021 年 OpenAI 發(fā)布的 DALL-E 數(shù)據(jù)集的 23 倍。SG328資訊網(wǎng)——每日最新資訊28at.com

國內(nèi)各行業(yè)數(shù)據(jù)資源豐富,2021-2026 年數(shù)據(jù)量規(guī)模 CAGR 高于全球,數(shù)據(jù)主要來源于政 府/傳媒/服務(wù)/零售等行業(yè)。據(jù) IDC ,2021-2026 年中國數(shù)據(jù)量規(guī)模將由 18.51ZB 增長至 56.16ZB ,CAGR 達(dá)到 24.9%,高于全球平均 CAGR。盡管國內(nèi)數(shù)據(jù)資源豐富,但由于數(shù)據(jù)挖掘不足,數(shù)據(jù)無法自由在市場(chǎng)上流通等現(xiàn)狀,優(yōu)質(zhì)中文優(yōu)質(zhì)數(shù)據(jù)集仍然稀缺。SG328資訊網(wǎng)——每日最新資訊28at.com

百度“文心”大模型訓(xùn)練特有數(shù)據(jù)主要包括萬億級(jí)的網(wǎng)頁數(shù)據(jù),數(shù)十億的搜索數(shù)據(jù) 和圖片數(shù)據(jù)等。阿里“通義”大模型的訓(xùn)練數(shù)據(jù)主要來自阿里達(dá)摩院。騰訊“混元”大模 型特有的訓(xùn)練數(shù)據(jù)主要來自微信公眾號(hào),微信搜索等優(yōu)質(zhì)數(shù)據(jù)。華為“盤古”大模型的訓(xùn)練數(shù)據(jù)公開數(shù)據(jù)外, 還有 B 端行業(yè)數(shù)據(jù)加持,包括氣象, 礦山, 鐵路等行業(yè)數(shù)據(jù)。商湯 “日日新”模型的訓(xùn)練數(shù)據(jù)中包括了自行生成的 Omni Objects 3D 多模態(tài)數(shù)據(jù)集。SG328資訊網(wǎng)——每日最新資訊28at.com

因此,在這個(gè)大模型的時(shí)代, 企業(yè)的數(shù)據(jù)工程中要融入面向大模型的數(shù)據(jù)架構(gòu),在數(shù)據(jù)產(chǎn)生時(shí)完成自行標(biāo)注,同時(shí)輔之以數(shù)據(jù)服務(wù)商提供的數(shù)據(jù),將大模型作為默認(rèn)選項(xiàng)形成自己的領(lǐng)域模型。SG328資訊網(wǎng)——每日最新資訊28at.com

拭目以待!SG328資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://m.rrqrq.com/showinfo-26-5203-0.html淺析數(shù)據(jù)工程

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: DDD 必備架構(gòu)--六邊形架構(gòu)

下一篇: 電腦軟件:分享五款高效的電腦寶藏軟件,值得收藏!

標(biāo)簽:
  • 熱門焦點(diǎn)
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
国产自产精品| 成人午夜精品一区二区三区| 国产精品国产三级国产专区53| 欧美日韩成人在线| 免费一区二区视频| 榴莲视频成人在线观看| 亚洲精品成人a在线观看| 欧美日韩亚洲国产精品| 久久久噜噜噜久噜久久综合| 成人精品免费看| 欧美精品丝袜久久久中文字幕| 三级欧美在线一区| 久久精品九九| 视频一区二区三区在线| 亚洲在线视频| 天天影视涩香欲综合网| 老司机午夜免费精品视频| 亚洲成人午夜影院| 色综合av在线| 天天色综合天天| 91久久精品国产91性色tv| 五月激情综合色| 色婷婷综合久色| 日本aⅴ亚洲精品中文乱码| 欧美在线观看你懂的| 久久99深爱久久99精品| 欧美日韩国产成人在线免费| 黄一区二区三区| aaa欧美大片| 久久久精品网| 日韩高清不卡在线| 欧美三级一区二区| 国产一区二区三区在线观看免费| 777a∨成人精品桃花网| 国产a级毛片一区| 久久久电影一区二区三区| 欧美一区精品| 中文字幕佐山爱一区二区免费| 亚洲激情一区二区| 三级亚洲高清视频| 666欧美在线视频| 91丨porny丨中文| 一区二区中文视频| 久久综合九色综合网站| 激情综合网天天干| 欧美xxxxxxxxx| 激情久久久久久| 亚洲二区视频在线| 欧美一级xxx| 亚洲一区成人| 欧美高清视频一区| 视频一区二区三区在线| 国产亚洲精品资源在线26u| 国产欧美在线| 欧美日韩1区| 久久er99精品| 亚洲国产中文字幕在线视频综合| 日韩精品在线网站| 3d成人h动漫网站入口| 欧美三级免费| 91看片淫黄大片一级| 国产美女视频一区| 喷白浆一区二区| 视频在线观看国产精品| 日韩一区在线免费观看| 久久久久久黄色| 噜噜噜躁狠狠躁狠狠精品视频| 亚洲妇熟xx妇色黄| 国产亚洲一区二区三区四区| 欧美视频完全免费看| 久久精品人人做人人爽97| 亚洲成人免费在线观看| 成人禁用看黄a在线| 亚洲视频在线一区| 欧美三区在线观看| 欧美日韩亚洲一区| 美女在线视频一区| 中文字幕在线一区| 欧美日韩一区二区视频在线观看| 国产精品欧美久久久久一区二区 | www日韩大片| 欧美专区在线| 91麻豆成人久久精品二区三区| 亚洲成精国产精品女| 久久网站热最新地址| 久久亚洲欧美| 欧美日本三区| 国产一区二区三区在线观看免费视频| 中文幕一区二区三区久久蜜桃| 欧洲精品一区二区| 精品不卡一区| 成人一级视频在线观看| 亚洲午夜精品网| 国产日韩精品一区二区三区| 日本久久精品电影| 亚洲乱码视频| 色综合天天天天做夜夜夜夜做| 免费成人美女在线观看| 亚洲人吸女人奶水| 久久久久高清精品| 在线播放中文字幕一区| 国产精品一卡| 亚洲一二三区在线| 99精品久久只有精品| 久久97超碰国产精品超碰| 日韩码欧中文字| 久久男人中文字幕资源站| 精品视频在线免费观看| 欧美专区18| 亚洲精品日韩久久| 国产精品hd| 91丨porny丨中文| 国产精品一区二区91| 人人爽香蕉精品| 五月婷婷久久丁香| 亚洲一区视频在线| 亚洲欧美日韩综合aⅴ视频| 国产午夜精品久久久久久久| 日韩一级黄色片| 欧美美女一区二区在线观看| 日本韩国欧美在线| 久久综合中文| 亚洲资源av| 亚洲一区二区三区精品在线观看 | 欧美成人首页| 成人激情开心网| 成人禁用看黄a在线| 国产盗摄视频一区二区三区| 韩国av一区二区三区| 久国产精品韩国三级视频| 日韩不卡一区二区| 麻豆精品在线播放| 麻豆免费精品视频| 美女视频黄久久| 极品少妇xxxx偷拍精品少妇| 久久99久久久久久久久久久| 美日韩一级片在线观看| 久久精品国产亚洲aⅴ| 久久福利资源站| 国产一区二区在线影院| 国产大陆a不卡| 成人白浆超碰人人人人| 欧美一区二区三区男人的天堂| 一区二区三区产品免费精品久久75 | 国产精品123区| 91麻豆精品国产| 成人丝袜高跟foot| 精品福利一二区| 欧美久久影院| 亚洲一区二区三区四区不卡| 日韩视频一区| 亚洲黄一区二区三区| 亚洲欧美卡通另类91av| 日本aⅴ亚洲精品中文乱码| 在线观看91精品国产入口| 日本欧美一区二区| 欧美日韩在线不卡| www.爱久久.com| 亚洲视频免费在线| 久久精品午夜| 狠狠色伊人亚洲综合网站色| 亚洲国产视频网站| 日韩欧美国产麻豆| 精品一区二区三区影院在线午夜| 久久久久91| 国产精品99久久久| 亚洲欧洲精品天堂一级| 色www精品视频在线观看| 福利一区二区在线观看| 国产精品卡一卡二| 欧美日韩国产天堂| 久久久久久亚洲精品杨幂换脸| 五月综合激情网| 亚洲精品免费看| 免费在线观看成人| 国产传媒一区在线| 欧美区视频在线观看| 日韩午夜中文字幕| 国产精品久线观看视频| 视频一区二区不卡| 成人短视频下载| 国产一区二区三区高清| 欧美日韩高清在线播放| 国产网站一区二区三区| 亚洲图片有声小说| 风间由美一区二区三区在线观看 | 久久电影国产免费久久电影 | 91在线观看一区二区| 国产一区二区三区奇米久涩| 欧美精品第1页| 成人免费一区二区三区视频 | 亚洲h动漫在线| 成人app下载| 久久久久久一区| 久久精品一区二区三区四区| 亚洲国产美女搞黄色| av激情综合网| 色婷婷精品大在线视频| 午夜a成v人精品| 欧美猛男gaygay网站|