TechWeb文/卞海川
微軟對OpenAI的總投資已經(jīng)超過130億美元,OpenAI卻把第一個桌面應用給了蘋果macOS。
在OpenAI春季發(fā)布會上,除了推出新旗艦模型“GPT-4o”之外,最大的亮點是這次活動中全程用iPhone和MacBook Pro進行演示,同時還發(fā)布了Mac桌面版的ChatGPT。
最近,TechWeb也收到了ChatGPT蘋果系統(tǒng)桌面版的更新推送,在使用了一段時間后我發(fā)現(xiàn),桌面版并不是將網(wǎng)頁版重新包裝成桌面App那么簡單,而是想改變用戶與GPT之間的互動方式,從而將使用AI工具的習慣深深刻入用戶的骨子里去。
我們來一起來簡單上手體驗一下。
設計界面
點開ChatGPT-Mac后,我們可以發(fā)現(xiàn)它基本和網(wǎng)頁版相似,都是簡單簡約的設計方式,同樣有三種模型可以選擇。
左側邊欄顯示的是歷史對話記錄。
當我們切換到最新版本的GPT-4o后,在界面的功能分布上,新增加了兩項功能,分別是錄音模塊與對話模塊。
GPT-4o模型可以支持文字、圖像、或聲音等不同模態(tài)的輸入,并且可以實時聯(lián)網(wǎng)查詢你所需要的一些信息。
比網(wǎng)頁版方便的是,你現(xiàn)在無論在哪個界面,都可以通過快捷鍵(默認option+空格)喚起聊天對話框,你可以選擇上傳照片,文件,甚至可以直接截圖,還可以打開攝像頭隨時拍照。
我們這里以截圖為例,比如我看到了一些有設計感的圖標,你可以實時截圖,發(fā)送給它,讓他幫你分析一下這類圖標的優(yōu)勢,甚至能讓它幫你設計一個類似的。
發(fā)送完之后,他可以跳回桌面端加載它回答的問題。
另外一個讓我喜歡的功能是窗口置頂功能,如果你需要長時間使用它,你可以將它隨意拖拽放大或縮小窗口,固定到屏幕的任意位置,方便我們后續(xù)的對話或者上傳文件。
雖然上述功能網(wǎng)頁版都可以實現(xiàn),但當產(chǎn)品真正植入你的電腦中,并且可以通過快捷鍵實時喚醒的時候,這個產(chǎn)品的體驗就被進一步革新了,對于工作的效率提升是非常明顯的。
OpenAI對該軟件的使用頻率是非常有信心的,它默認把軟件設置在常駐應用欄中,與系統(tǒng)級的原生應用(郵件、備忘錄、日歷)、日常生產(chǎn)力應用(辦公軟件、瀏覽器)同級。
在如今的媒體報道上,我們經(jīng)常能看到國內(nèi)大模型屠榜的消息,甚至某項數(shù)據(jù)表現(xiàn)超越GPT,可是單從商業(yè)化這一小步來講,OpenAI可能再一次領先行業(yè),畢竟它優(yōu)先搶占了我們電腦中的位置,從而不斷提高未來自己的市場占有率。
目前,桌面版的體驗優(yōu)先像Plus付費版用戶推送,數(shù)周后普通用戶也可以完成下載,Windos客戶端也會在今年內(nèi)發(fā)布,OpenAI的宏偉愿景是面向所有互聯(lián)網(wǎng)用戶的桌面,成為用戶日后習以為常的默認應用。
ChatGPT4o桌面版的一些應用場景?
一個優(yōu)秀的大模型不僅需要具備強大的語言生成和理解能力,更需要在實際應用場景中展現(xiàn)其價值。
這里我們以ChatGPT4o桌面版,聚焦內(nèi)容創(chuàng)作、教育輔導、工作翻譯三個場景來評測一下它帶給用戶的實際價值。
內(nèi)容創(chuàng)作
在內(nèi)容創(chuàng)作領域,它可以幫助用戶生成高質(zhì)量的文本內(nèi)容,包括文章、報告、廣告文案等。
TechWeb認為,ChatGPT4o桌面版帶給用戶的價值更多的是在提供豐富的創(chuàng)意和靈感,打破創(chuàng)意瓶頸。
比如這里我們是一位作家,想嘗試新的文體風格,寫一篇小說。我們可以給ChatGPT4o一些關鍵詞,GPT就可以給我們提供非常多的思路。
這對創(chuàng)作者的時間提升是非常明顯的,我們可以讓大模型自動生成初稿,創(chuàng)作者專注于修改和潤色工作。
除了文字的創(chuàng)作,GPT在代碼生成的能力也是非常強的,我們從網(wǎng)上找一張打磚塊的截圖,上傳給GPT-4o,讓他寫一個游戲代碼,整個時長不到30秒。
利用該代碼,我們在能運行python的軟件打開,游戲很快就出來了。
GPT在桌面端的提升主要是在實時調(diào)用方面,我們在日常網(wǎng)頁瀏覽、文件閱讀等環(huán)節(jié),都可以通過快捷鍵進行喚醒,隨時查詢,實時輸入內(nèi)容,方便我們在瀏覽網(wǎng)頁或者辦公的時候隨時交流。
教育輔導
大模型在教育領域的應用,特別是個性化教育輔導,展現(xiàn)了巨大的潛力。它是所有學科的老師,并且有著非常高的準確率。
GPT有了桌面版,我們可以邊用電腦上網(wǎng)課,邊截圖,把自己沒聽懂的習題再發(fā)給GPT做記錄,隨時隨地解析,非常方便。
另外一個比較有意思的功能是,你甚至可以讓GPT幫你判作業(yè),比如這樣:
我們故意答錯了幾個答案,果然都被GPT都識別了出來,并且還會告訴你正確的運算順序。
當然這個功能還是有些小瑕疵,比如在顯示方式上還有一些小錯誤,但不影響最終的結果。
工作翻譯
GPT-4o的發(fā)布,展示了可以毫秒級反應、識別人類情緒進行音視頻交互等新能力。這就讓我們想到了一個新的場景,也就是實時翻譯。
在需要翻譯的場景中,我們可以跟GPT說,現(xiàn)在我要你充當翻譯官的角色,我說中文,你翻譯成英文,我說英文,你翻譯成中文,這樣我就能和我的國外好朋友實時交流了。
在實測之后,我們發(fā)現(xiàn)不管是什么語言,他都可以輕松翻譯,而且反應非???,根據(jù)OpenAI發(fā)布在官網(wǎng)的最新博客文章,在GPT-4o之前,語音模式與ChatGPT對話,平均延遲為2.8秒(GPT-3.5)和5.4秒(GPT-4)。
而現(xiàn)在,GPT-4o最快可以在 232 毫秒的時間內(nèi)響應音頻輸入,平均響應時長320毫秒,與人類相似。
不過比較遺憾的是,當我們想讓它在實時會議中參與并總結要點時,GPT好像還做不到,這個語音功能目前還并不完善,不過相信等未來視覺功能推送后,旁聽會議并總結這個場景一定會實現(xiàn)。
寫在最后
GPT-4o桌面版的發(fā)布,不僅展示了OpenAI在技術上的領先地位,更是其用戶體驗戰(zhàn)略的一大步。
通過將AI工具無縫集成到用戶的日常工作和生活中,OpenAI正逐步改變我們與技術互動的方式。這不僅提升了我們的工作效率,更為我們的創(chuàng)作和學習帶來了前所未有的便利。
未來,隨著GPT-4o的不斷更新和完善,以及Windows客戶端的推出,OpenAI的愿景是讓每一位互聯(lián)網(wǎng)用戶都能輕松使用AI工具。無論是在內(nèi)容創(chuàng)作、教育輔導,還是工作翻譯等場景中,ChatGPT-4o都將成為我們不可或缺的助手,幫助我們更高效地完成各種任務。
這一次,OpenAI通過與蘋果的合作,為我們帶來了一款不僅僅是工具的應用,而是一個能夠真正改變我們?nèi)粘I畹膭?chuàng)新產(chǎn)品。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )