OpenAI最強“企業(yè)版”炸場(chǎng),B端大模型市場(chǎng)會(huì )“贏(yíng)家通吃”嗎?
速度翻倍、安全加密、調用GPT-4無(wú)上限,今天凌晨,OpenAI官宣的企業(yè)專(zhuān)用版ChatGPT堪稱(chēng)“最強ChatGPT版本”!
同普通版ChatGPT相比,企業(yè)版性能更加強大,包括:提供無(wú)限制的GPT-4訪(fǎng)問(wèn),速度提升2倍,支持無(wú)限制高級數據分析,支持可用于4倍輸入和文件的32k Tokens上下文窗口,提供可共享的聊天模板和免費的API接口、保證企業(yè)的數據隱私和安全等。
(資料圖片僅供參考)
除了目前適合大型企業(yè)的版本之外,OpenAI還將很快推出適用于各類(lèi)小型團隊的自助式 ChatGPT Business 產(chǎn)品,服務(wù)于所有規模和類(lèi)型的組織。也就是說(shuō),從今天開(kāi)始,OpenAI已然吹響了向B端市場(chǎng)全面進(jìn)攻的號角。
自然,這就帶來(lái)了一個(gè)問(wèn)題:面向企業(yè)的B端AI大模型市場(chǎng),會(huì )“贏(yíng)家通吃”嗎?
最近,美國光速創(chuàng )投(Lightspeed Venture Partners)合伙人Guru Chahal深度分析了這一問(wèn)題。
作者認為,B端最有可能的路徑,是企業(yè)在探索階段使用大型模型,隨著(zhù)在實(shí)際使用中對大模型理解的加深,逐漸轉向生產(chǎn)階段使用更小型、專(zhuān)業(yè)化(調整+精煉)的模型。
Chahal還提到了企業(yè)在選擇模型時(shí)需要考慮的因素,以及AI基礎設施的發(fā)展機遇,包括評估框架、模型運行與維護、增強系統、運維工具、數據利用等各個(gè)方面。
文章干貨很足,相信對想了解B端AI市場(chǎng)、AI基礎設施、未來(lái)機遇等方面的朋友一定大有裨益。
以下為全文內容,大家enjoy~??
目錄:
●?大模型生態(tài)系統分類(lèi)
● 將用例與模型匹配
● 未來(lái)機遇在何方
在過(guò)去的十數年里,作為L(cháng)ightspeed團隊一員,我親歷了人工智能和機器學(xué)習領(lǐng)域的驚人創(chuàng )新,這主要歸功于我們與卓越創(chuàng )業(yè)者的深度合作。
現在,我們與他們的公司、所構建的平臺,以及服務(wù)的客戶(hù)進(jìn)一步合作交流,以便更系統地了解企業(yè)如何思考生成式AI。
具體來(lái)說(shuō),我們深入探究了大模型生態(tài)系統,嘗試探討諸如“性能最強大模型是否會(huì )贏(yíng)家通吃?”、“企業(yè)在使用時(shí)是否會(huì )一味依賴(lài)OpenAI的API,還是選擇更加多樣化的實(shí)際用例?”這一類(lèi)問(wèn)題。
這些問(wèn)題的答案,將決定該未來(lái)大模型生態(tài)系統的增長(cháng)方向,以及算力、人才和資金的流向。
大模型生態(tài)系統分類(lèi)
根據我們的研究,我們認為,人工智能領(lǐng)域正在經(jīng)歷一次“寒武紀式”的模型大爆發(fā)。未來(lái),開(kāi)發(fā)者和企業(yè)將根據實(shí)際需求選擇最適合的模型,盡管在探索階段的使用的可能更加集中。
B端最有可能的路徑,是企業(yè)在探索階段使用大型模型,隨著(zhù)在實(shí)際使用中對大模型理解的加深,逐漸轉向生產(chǎn)階段使用更小型、專(zhuān)業(yè)化(調整+精煉)的模型。
下圖展示了我們對基礎模型生態(tài)系統演化的看法。
我們認為,人工智能模型領(lǐng)域可以分為三個(gè)主要、但又有些交叉的類(lèi)別:
類(lèi)別1:巨腦模型?
這些是最優(yōu)秀的模型,也是模型領(lǐng)域的先驅。它們產(chǎn)生了令人驚嘆的演示效果,深深吸引了我們的注意。當開(kāi)發(fā)者試圖探索人工智能對其應用的潛力極限時(shí),這些模型往往是默認的起點(diǎn)。
這些模型的訓練成本高,維護和擴展復雜。但同一個(gè)模型可以應對法學(xué)院入學(xué)考試(LSAT)、醫學(xué)院入學(xué)考試(MCAT),撰寫(xiě)高中論文,并像聊天機器人朋友一樣與你互動(dòng)。目前,開(kāi)發(fā)者正在這些模型上進(jìn)行實(shí)驗,并評估在企業(yè)應用中的人工智能使用情況。
需要注意的是,這些模型的使用成本高,推理延遲較大,并且在明確定義的受限用例中可能過(guò)于復雜。
同時(shí),這些模型是通用模型,可能在專(zhuān)業(yè)任務(wù)上不夠準確(例如,參見(jiàn)康奈爾大學(xué)等的綜合研究)。
而且,它們也是黑匣子,可能給企業(yè)帶來(lái)隱私和安全挑戰,企業(yè)正在探索如何在不泄露數據的情況下利用這些模型。
OpenAI、Anthropic、Cohere都屬于這一類(lèi)別。
類(lèi)別2:挑戰者模型?
這些模型同樣具有高能力,僅次于領(lǐng)先模型。Llama 2和Falcon是這一類(lèi)別中的佼佼者。它們通常與類(lèi)別1模型中的“N-1”或“N-2”模型一樣優(yōu)秀。
據某些基準測試,Llama 2?甚至與GPT-3.5-turbo相媲美。通過(guò)在企業(yè)數據上進(jìn)行調整,這些模型在特定任務(wù)上的能力可與類(lèi)別1中模型相當。
其中許多模型是開(kāi)源的(或非常接近)。一旦發(fā)布,它們往往會(huì )被開(kāi)源社區迅速改進(jìn)和優(yōu)化。
類(lèi)別3:長(cháng)尾模型?
這些是“專(zhuān)家”模型。它們專(zhuān)為特定目標構建,例如對文件進(jìn)行分類(lèi)、識別圖像或視頻中的特定屬性、識別商業(yè)數據中的模式等。這些模型靈活,訓練和使用成本低,可以在數據中心或邊緣上運行。
僅需瀏覽Hugging Face,即可窺見(jiàn)這一生態(tài)系統的廣度之大,未來(lái)還會(huì )因為它為各種用例提供服務(wù)而不斷擴大!
將用例與模型匹配
盡管尚處于早期階段,但我們已經(jīng)看到一些領(lǐng)先的開(kāi)發(fā)團隊和企業(yè)開(kāi)始以這種精細的方式思考這個(gè)生態(tài)系統。他們渴望將用例與最適合的模型匹配,甚至可能在更復雜的用例中使用多個(gè)模型。
在選擇使用哪個(gè)/哪些模型方面,通常會(huì )考慮以下因素:
a.?數據隱私和合規要求,這會(huì )影響模型是在企業(yè)基礎架構中運行,還是數據可以發(fā)送到外部托管的推理終端。
b.?能否對模型進(jìn)行微調對這個(gè)用例是否至關(guān)重要或者強烈希望進(jìn)行微調。
c.?期望的推理“性能”水平(延遲、準確性、成本等)。
實(shí)際清單通常比上述內容更長(cháng),反映了開(kāi)發(fā)者希望利用人工智能解決的各種多樣用例。
機遇在哪里???
這一新興生態(tài)系統產(chǎn)生了幾個(gè)重要影響:
① 評估框架:企業(yè)將需要工具和專(zhuān)業(yè)知識,來(lái)評估哪個(gè)模型適合哪個(gè)用例。
開(kāi)發(fā)者需要決定如何最好地評估特定模型是否適合“所需工作”。評估需要考慮多個(gè)因素,不僅包括模型性能,還包括成本、可以行使的控制水平等。
② 運行和維護模型:預計將出現用于幫助企業(yè)訓練、微調和運行模型的平臺,特別是第三類(lèi)長(cháng)尾模型。
這些平臺過(guò)去通常被稱(chēng)為ML Ops平臺,我們預計這個(gè)定義將擴展到包括生成式人工智能。Databricks、Weights and Biases、Tecton等平臺正在迅速朝這個(gè)方向發(fā)展。
③ 增強系統:模型,特別是托管的LLM(檢索增強模型),需要通過(guò)增強生成提供卓越的結果。
這涉及做出次級決策,包括:
o?數據和元數據攝?。?/strong>如何連接結構化和非結構化的企業(yè)數據源,然后攝取數據以及關(guān)于訪(fǎng)問(wèn)策略等方面的元數據。
o?生成和存儲嵌入:選擇用于為數據生成嵌入的模型。然后,如何存儲這些嵌入:根據所需性能、規模和功能選擇哪個(gè)向量數據庫?
在這里,存在機會(huì )來(lái)構建面向企業(yè)的RAG(檢索增強生成)平臺,以簡(jiǎn)化選擇和組合這些平臺所帶來(lái)的復雜性:
①?運維工具:企業(yè)IT部門(mén)需要為工程團隊建立監管措施,管理成本等。
與今天為軟件開(kāi)發(fā)所做的所有工作一樣,他們需要擴展這些任務(wù),以包括人工智能的使用。IT感興趣的領(lǐng)域包括:
o?可觀(guān)測性:模型在生產(chǎn)環(huán)境中的表現如何?它們的性能是否隨時(shí)間改善/惡化?是否存在可能影響未來(lái)應用程序版本中模型選擇的使用模式?
o?安全性:如何確保AI本地應用程序的安全性。這些應用程序是否容易受到新的攻擊方式的攻擊,需要新的平臺?
o?合規性:我們預計AI本地應用程序和LLM的使用將需要符合相關(guān)主管機構已開(kāi)始制定的框架。這是除了隱私、安全、消費者保護、公平性等現有合規性制度之外的。企業(yè)將需要平臺來(lái)幫助他們保持合規性、進(jìn)行審計、生成合規性證明等相關(guān)任務(wù)。
② 數據:預計將迅速采用幫助企業(yè)了解其數據資產(chǎn)以及如何通過(guò)使用新型人工智能模型從這些資產(chǎn)中提取最大價(jià)值的平臺。
正如地球上最大的軟件公司之一曾對我們說(shuō)的那樣,“我們的數據是我們的壕溝,我們的核心IP,我們的競爭優(yōu)勢?!?/p>
通過(guò)利用人工智能將這些數據貨幣化,以一種在不削弱防御能力的情況下推動(dòng)“差異化”的方式,將是關(guān)鍵。Snorkel等平臺在其中發(fā)揮著(zhù)關(guān)鍵作用。
我們認為,現在正是構建人工智能基礎設施平臺的絕佳時(shí)機。
盡管人工智能的應用將繼續改變整個(gè)行業(yè),但要想使每個(gè)企業(yè)都能采用這一強大技術(shù),就需要支持基礎設施、中間件、安全性、可觀(guān)測性和操作平臺。
本文來(lái)源:硬AI
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: