午夜在线-午夜视频网站-日韩城人网站-娇妻被邀上台玩多p-国产美女久久久-黄色免费观看网站-黄色片91-男女视频免费观看-久久瑟瑟-华人在线视频-人妻少妇精品无码专区久久-爆操白丝美女-国产免费一级视频-中文字幕 自拍偷拍-精品国产一区二区三区四区精华-青青草久-黄色精品视频在线观看-福利片网址-精品熟女一区二区-黄污下载-国产美女免费观看-久久久久久久久艹-好吊妞一区二区三区-蜜臀一区二区三区精品免费视频-蜜桃视频免费网站-91视频黄污-日韩成人视屏-黄网站视频免费-亚洲精品国产精品乱码不99热-久久中文字幕国产

?
快捷導(dǎo)航
ai動(dòng)態(tài)
大模型做通用 Or 垂直?中小AI公司的「生死抉擇



  通用大模型,聚焦基礎(chǔ)層,以技術(shù)攻關(guān)為目的。他們對標(biāo)ChatGPT做通用大模型,百度的文心一言,阿里的通義千問、科大訊飛的星火大模型等都?xì)w屬這一類。

  垂直大模型,聚焦解決垂直領(lǐng)域問題,以產(chǎn)品開發(fā)為目的。他們在通用大模型基礎(chǔ)上訓(xùn)練行業(yè)專用模型,應(yīng)用到金融、醫(yī)療、教育、養(yǎng)老、交通等垂直行業(yè)。

  垂直大模型以此為切入點(diǎn),選擇了另一條路徑。他們以具備的行業(yè)知識為基礎(chǔ),通過與通用大模型企業(yè)合作的方式,訓(xùn)練行業(yè)專用模型。

  “站在客戶角度,行業(yè)客戶最為看重的是定制化的需求,以及AI企業(yè)的工程化落地能力。”眾數(shù)信科CEO吳炳坤對雷峰網(wǎng)(公眾號:雷峰網(wǎng))說。

  作為垂直大模型的一員,眾數(shù)信科成立于2021年初,由云從科技、廈門火炬創(chuàng)投、民生電商發(fā)起成立。

  眾數(shù)信科定位AIGC領(lǐng)域的“知識智能化”,即將數(shù)字城市領(lǐng)域沉淀的行業(yè)數(shù)據(jù)、專家經(jīng)驗(yàn),通過AI 技術(shù)進(jìn)行工程化。

  吳炳坤將AI比作工業(yè)時(shí)代的石油鉆機(jī):“沒有鉆井機(jī),石油就無法成為工業(yè)時(shí)代的黑色血液;數(shù)據(jù)要素時(shí)代,沒有AI,數(shù)據(jù)的價(jià)值也就得不到充分挖掘。現(xiàn)在大模型帶來了無限的想象和發(fā)展機(jī)會(huì)。”

  兩年前,在數(shù)字城市領(lǐng)域,AI更多基于小模型,比如算法只做人臉識別,或只做車牌識別,產(chǎn)品受限很大,研發(fā)成本很高,可以擴(kuò)展的空間不多。

  現(xiàn)在,隨著 AI 大模型這一關(guān)鍵技術(shù)的突破,數(shù)據(jù)和AI的結(jié)合度更加緊密,上述問題都得以突破。

  大模型將對全行業(yè)都產(chǎn)生顛覆性地重構(gòu),已經(jīng)是業(yè)界共識。百度李彥宏、阿里張勇等不少業(yè)界大佬都在不同場合,不斷重復(fù)同樣一句話:AI 大模型時(shí)代,每個(gè)行業(yè)的應(yīng)用都值得重新做一遍。

  阿里巴巴張勇曾指出,超萬億參數(shù)的大模型研發(fā)是一場“AI+云計(jì)算”的全方位競爭,囊括了算法、底層龐大算力、網(wǎng)絡(luò)、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等諸多領(lǐng)域,是一項(xiàng)復(fù)雜的系統(tǒng)性工程。

  一方面,通用大模型需要大量有效的數(shù)據(jù)與計(jì)算資源,這離不開超大規(guī)模的AI基礎(chǔ)設(shè)施的支撐;另一方面,長時(shí)間的訓(xùn)練、推理背后,也往往意味著高昂的成本。

  正因此,當(dāng)下大模型市場的主角大都是來自于移動(dòng)互聯(lián)網(wǎng)時(shí)代的大巨頭,如百度“文心一言”、阿里“通義千問”、騰訊“混元”等。

  大公司們瞄準(zhǔn)廣泛適用的人群,齊齊布局 NLP、CV、跨模態(tài)等多種模型,動(dòng)用同樣海量的數(shù)據(jù)參數(shù)進(jìn)行預(yù)訓(xùn)練,動(dòng)作整齊劃一。

  這種“你有,我也有”既是實(shí)力的展現(xiàn),同時(shí)也存在同質(zhì)化問題,會(huì)逐漸消弭彼此之間的辨識度,難以在市場中發(fā)揮優(yōu)勢。

  并且,大模型“海納百川”的魅力縱然令人著迷,但其終歸是一項(xiàng)技術(shù),技術(shù)只有與具體應(yīng)用結(jié)合變成產(chǎn)品,帶來實(shí)際的使用體驗(yàn)和轉(zhuǎn)化成效,才真正具有價(jià)值。

  行業(yè)客戶使用大模型的最終目的,是讓業(yè)務(wù)發(fā)展走上新的臺(tái)階。因而,他們需要的不是綜合技術(shù)上的碾壓,而是能在具體需求上追求極致,可以實(shí)現(xiàn)功能最大化的產(chǎn)品。

  他們受限于資金和技術(shù),難以走上通用大模型的角斗場,但由于本身具備一定的行業(yè)領(lǐng)域知識,反而在垂直大模型的探索上具備天然優(yōu)勢。

  在人工智能時(shí)代的浪潮中,聚焦少數(shù)細(xì)分賽道,在通用大模型的底座能力之上,圍繞“如何用好大模型”這一接地氣的主題,已經(jīng)成為小公司們安身立命的根本。

  當(dāng)下,很多主流的AI大模型,并沒有對外開放模型的訓(xùn)練和微調(diào)。較為普遍的做法是,將模型開發(fā)好以后,給用戶提供一個(gè)接口調(diào)用。

  首先,AI大模型的打造是一個(gè)從算力,到整個(gè)框架,到模型再到應(yīng)用的遞進(jìn)過程,當(dāng)下AI大廠更多處在夯實(shí)基礎(chǔ)能力的階段。

  其次,AI產(chǎn)品進(jìn)入行業(yè),需要跟外部行業(yè)應(yīng)用做適配協(xié)同,目前國內(nèi)的AI大模型做得還不夠成熟,當(dāng)下這個(gè)時(shí)間點(diǎn),AI大廠還不太具備工程化落地的能力。

  這一現(xiàn)實(shí)背景下,垂直大模型玩家要想在通用大模型的基礎(chǔ)上微調(diào)和推理,定制行業(yè)專用模型,并非易事。

  基于和云從科技的關(guān)系,眾數(shù)信科不僅能夠參與進(jìn)云從大模型的開發(fā)過程,還可以在云從大模型的基礎(chǔ)上訓(xùn)練和微調(diào)自有的專業(yè)模型。

  “通過云從,眾數(shù)信科可以獲得更加便捷的接口,更加開放的合作架構(gòu),定制化的銜接服務(wù)。現(xiàn)在市場上除了AI大廠,其他公司不具備這個(gè)能力,這是現(xiàn)階段眾數(shù)信科有別于其他創(chuàng)業(yè)公司的優(yōu)勢。”吳炳坤說。

  在吳炳坤看來,大模型在業(yè)務(wù)落地過程中,需要不斷強(qiáng)化三個(gè)方面的要素:一是人工智能技術(shù)研發(fā),二是可觸達(dá)用戶的行業(yè)場景,三是高質(zhì)量的行業(yè)數(shù)據(jù)語料。

  底層技術(shù)方面,有云從科技的算法、算力做背書;在應(yīng)用場景上,有廈門火炬創(chuàng)投提供的制造業(yè)產(chǎn)業(yè)數(shù)字化實(shí)踐基地;在落地過程中,則有民生電商提供金融和產(chǎn)品商業(yè)化落地的資源支持。

  靜態(tài)數(shù)據(jù)相對穩(wěn)定,不會(huì)發(fā)生即時(shí)變化,獲取路徑較為清晰,比如廣泛存在于各級政府部門、國企、企業(yè)中的自有文檔,以及數(shù)據(jù)庫中的數(shù)據(jù)等。

  動(dòng)態(tài)數(shù)據(jù)指不同行業(yè)場景中每時(shí)每刻產(chǎn)生的數(shù)據(jù),這部分?jǐn)?shù)據(jù)不斷更新、變化,不容易獲得,是與其他競爭者拉開距離的關(guān)鍵能力。

  過去兩年,眾數(shù)信科以“i城市生活服務(wù)平臺(tái)”為媒介,觸及了國內(nèi)6個(gè)省16個(gè)城市的3000萬個(gè)人用戶和數(shù)十萬企業(yè)用戶,積累了大量數(shù)據(jù)。

  通過i城市服務(wù)平臺(tái),眾數(shù)信科積累了豐富的場景數(shù)據(jù),G/B/C端用戶需求和行業(yè)know-how,依托主流大模型技術(shù)底層能力,為客戶提供專業(yè)領(lǐng)域的知識智能工程化產(chǎn)品和KAAS服務(wù)。

  此外,由于當(dāng)下通用大語言模型在專業(yè)領(lǐng)域里可訓(xùn)練的語料較為缺乏,因此語言模型落地細(xì)分領(lǐng)域過程中,知識局限、認(rèn)知偏見、記憶幻覺等問題時(shí)有發(fā)生。

  其中,知識局限、認(rèn)知偏見問題,可以隨著數(shù)據(jù)的不斷積累、量變,得到解決,更大的難點(diǎn)來自于記憶幻覺。

  本質(zhì)原因在于,語言模型并非傳統(tǒng)理解中的一個(gè)數(shù)據(jù)庫,沒有真正的記憶能力,無法記住過去處理過的信息。而是通過訓(xùn)練數(shù)據(jù)學(xué)習(xí)文本序列的數(shù)據(jù)分布,然后再根據(jù)學(xué)習(xí)到的數(shù)據(jù)分布生成文本序列,最終生成內(nèi)容。

  吳炳坤表示,“大模型并非一蹴而就,而是一個(gè)不斷動(dòng)態(tài)優(yōu)化的過程。眾數(shù)信科會(huì)根據(jù)特定行業(yè)場景,以及對知識庫上下文的學(xué)習(xí)等特定方法,在較大程度上規(guī)避生成內(nèi)容‘胡編亂造’的情況,同時(shí)不斷和客戶做基于人類反饋的強(qiáng)化學(xué)習(xí)。”

  通過 G 端切入,能夠快速覆蓋市場,同時(shí)批量聚攏B端和C端資源,最終將B端行業(yè)客戶經(jīng)驗(yàn),快速復(fù)制到C端。

  以教育行業(yè)為例,眾數(shù)信科依托云從的從容大模型,首先打造出了適用于學(xué)校、培訓(xùn)機(jī)構(gòu)的教育行業(yè)專用模型,并已在廈門部分地區(qū)試點(diǎn)使用。

  第一步,積累和標(biāo)注。基于多年在數(shù)字平臺(tái)建設(shè)和運(yùn)營中積累的教師行業(yè)專業(yè)語料數(shù)據(jù),同時(shí)依托行業(yè)專家經(jīng)驗(yàn)對數(shù)據(jù)進(jìn)行標(biāo)注,形成專有領(lǐng)域的訓(xùn)練數(shù)據(jù)。

  第二步,訓(xùn)練和微調(diào)。在前者的基礎(chǔ)上,依托云從的從容大模型,采用知識蒸餾、權(quán)值量化、剪枝等工程化手段,將通用、龐大的教師網(wǎng)絡(luò),訓(xùn)練成一個(gè)特定行業(yè)的學(xué)生網(wǎng)絡(luò)。

  第三步,落地和反饋。進(jìn)入具體場景,并在此后運(yùn)營過程中,不斷積累用戶的正負(fù)反饋,通過基于人類反饋的強(qiáng)化學(xué)習(xí),反向打磨教育行業(yè)模型。

  上述三個(gè)步驟中,專家的數(shù)據(jù)標(biāo)注,以及基于人類反饋的強(qiáng)化學(xué)習(xí),是兩個(gè)必經(jīng)的難點(diǎn)。解決這兩個(gè)難點(diǎn),需要通過推廣行業(yè)應(yīng)用,加強(qiáng)知識積累,不斷自我迭代逐步解決。

  現(xiàn)階段,眾數(shù)信科的行業(yè)專用模型還處在教師的“數(shù)字助理”階段。“數(shù)字助理”具備課件自動(dòng)生成、靈活生成考題、對學(xué)生進(jìn)行個(gè)性化評價(jià)等服務(wù),教師在生成內(nèi)容的基礎(chǔ)上做最后的審核把關(guān)即可。

  一方面,“數(shù)字助理”通過輔助教學(xué)的方式,可以大大解放教師的精力,不斷提升教學(xué)效率;另一方面,在與教師共同工作過程中也可以不斷學(xué)習(xí),最終成長為優(yōu)秀教師的“數(shù)字分身”,達(dá)到接近一位優(yōu)秀教師的程度。

  目前,我國教育資源供給側(cè)明顯不足,先進(jìn)地區(qū)和落后地區(qū)的教育資源差距較大。打造教育行業(yè)模型的意義在于,可以借助AI,將先進(jìn)地區(qū)的先進(jìn)學(xué)校的先進(jìn)教師經(jīng)驗(yàn)傳承下來,帶到部分教育資源供給不足的地區(qū)。

  眾數(shù)信科采取了兩條腿走路的辦法,即分別在教育先進(jìn)地區(qū)和教育落后地區(qū)推廣“數(shù)字助理”和“數(shù)字分身”。

  “將先進(jìn)地區(qū)教師知識的沉淀,放在同樣先進(jìn)的地區(qū),可能不能滿足需求,但在一些教育落后地區(qū),基本上能夠符合當(dāng)?shù)氐氖褂眯枨蟆?rdquo;

  吳炳坤向雷峰網(wǎng)透露,今年下半年,眾數(shù)信科將在黑龍江教育資源比較欠缺的地區(qū),進(jìn)行“數(shù)字分身”的布局。

  未來,隨著教育行業(yè)的模型沉淀和知識積累,因人施教也是教育模型功能演化的重要方向。“數(shù)字分身”可以進(jìn)一步走入家庭,根據(jù)不同學(xué)生提供差異化教育方案,做到因人施教,為家庭教育減負(fù)。

  一方面,行業(yè)的快速發(fā)展,催促著企業(yè)要迅速產(chǎn)生爆款產(chǎn)品,同時(shí)形成快速迭代的能力。這對企業(yè)的人才儲(chǔ)備、產(chǎn)品和技術(shù)路線、戰(zhàn)略決斷能力、資金儲(chǔ)備等都提出了更高的要求。

  另一方面,隨著來自不同背景的玩家相繼入局,競爭格局也將隨之變化,比如教育領(lǐng)域,科大訊飛、猿輔導(dǎo)等都已悉數(shù)入場。



 

上一篇:Andrej Karpathy 最新視頻盛贊 DeepSeek:R1 正在發(fā)現(xiàn)人
下一篇:商湯徐立:未來核心戰(zhàn)略在于無縫集成基礎(chǔ)設(shè)施
?

服務(wù)電話:400-992-1681

服務(wù)郵箱:wa@163.com

公司地址:貴州省貴陽市觀山湖區(qū)金融城MAX_A座17樓

備案號:網(wǎng)站地圖

Copyright ? 2021 貴州立即博官網(wǎng)信息技術(shù)有限公司 版權(quán)所有 | 技術(shù)支持:立即博官網(wǎng)

  • 掃描關(guān)注立即博官網(wǎng)信息

  • 掃描關(guān)注立即博官網(wǎng)信息