欧美日韩午夜_五月天激情综合_国产精品久久久久一区二区三区_色女人av_国产福利av_欧美日韩中

實測 Manus :我用它生成了 10 個邀請碼……好玩,但崩潰

2025-3-9 19:55| 發布者: 崔時龍| 查看: 334| 評論: 0



今天凌晨剛剛發布的 Manus 有多震撼人心,已不需要贅述了:較高程度的獨立思考能力,強大的復雜任務解決能力,以及可靠的交付效果。

和純粹的對話式 AI 產品相比,Manus 話少,不止于思考,還能干活;和傳統虛擬助手相比,Manus 的分解、規劃和解決問題能力(通過 computer use 和編程能力體現)更高。

目前具體細節還很有限,但我們通過公開資料了解和猜測,Manus 的背后有不同 agent 各自處理單項任務,agent 的任務進度同步和轉移通過 API 執行。作為產品的 Manus,是一個多模型、多獨立 Agent 的縫合體——而團隊也通過“套殼”的自黑表述承認了這一點。但這并不能消解 Manus 作為一個成型的,遠高于最小可行水平的產品的意義。

Manus 讓人機交互的范式,升級為人機協作,比其它同類選手更接近真正意義上的通用 AI Agent。



Manus 目前一「碼」難求,在閑魚的開價一度達到 5 萬元。

APPSO 也用 Manus 進行了實測,但由于任務用時較長,后面又遭遇網站登陸困難的情況,所以只完成了幾個簡單的任務,其它任務恰逢 Manus 系統超負載,沒能進行下去。

與此同時,Manus 項目方也發出了一份官方回應,表示準備服務器資源不足,導致用戶體驗較差。



APPSO 無疾而終的測試


先來看我們在有限的時間內做的兩個測試。

和很多人一樣,我們經常會對日新月異的 AI 技術和五花八門的 AI 工具感到困惑。于是我向 Manus 提出了這個請求:



從 Manus 返回的初步結果看,它先搜索了一些 AI 資訊門戶式的網站,意思應該是先掌握大概的分類方式,確認表格的分類維度,然后再分門別類地去找對應的 AI 工具,查詢資料。

它找到了 17 個類別——正在看文章的讀者,如果你也不知道這些 AI 工具該怎么分類,可以參考 Manus 的思考結果了:



在聯網搜索過程中,Manus 偶爾會遇到瀏覽器故障的情況。不過沒關系,它會自行處理這些錯誤,重試或繼續下一項任務。

但是沒過多久,它還是崩潰了。這一天當中,我們從 APPSO 讀者搜集了十幾個任務請求,喂給 Manus,結果也是一樣的:高系統負載導致了內部服務器錯誤,請稍后重試或創建一個新的對話。



一氣之下,我讓 Manus 直接生成 10 個邀請碼,它倒是挺干脆。



當然,沒一個能用的。別忘了今天是星期四……

我們找到了一些已經玩上了的朋友,看看他們都是怎么用 Manus 的。

使用 Manus 的過程,也是直接近距離觀察它的思考路徑、工作流程的,一次難得的機會。

先來一個腦洞大開的:

《文明》(Google CEO 版)


想象一個游戲,你能在里面扮演一個科技創業者,歷經艱難險阻,克服重重危機,將公司打造為全球科技龍頭,改寫人類歷史?

有人就做了這么一個 谷歌 CEO 模擬器,帶你體驗谷歌歷史上的重要決策,重走從車庫出發,直到成為科技巨頭的傳奇之路。

游戲將谷歌的公司歷史分為了 5 個關鍵發展階段:創業、長大(pre-IPO)、擴張、多元化、重組更名 (Alphabet 階段)。在每一個階段,游戲都給玩家提供了多個關鍵抉擇,每個都將影響公司的發展方向、資源分配,以及最終的成就。

更有意思的是,它還特別加入了一些在經營類游戲里常見的「突發隨機事件」,來考驗玩家作為谷歌 CEO 的危機處理能力。

讓我們開始游戲——居然還可以選難度?我直接 hard mode.



APPSO 的讀者恐怕對現實世界里的谷歌足夠熟悉了,不妨跟我一起來一場抽象離譜的大冒險?

困難模式,初始資金 $80,000,我通過聯合創始人的女朋友,租用了她姐姐的車庫,創辦了 Google。初期我們的技術實力一般,其它各方面要素都十分匱乏——但好在,我們在大學期間研究搜索引擎項目「搓背」(BackRub) 已經初具雛形,特別是里面的 PageRank 算法,很有潛力。

我們拿到了第一筆天使投資,但這筆錢究竟應該怎么用?是繼續優化 PageRank,還是換個寬敞點、有空調的辦公室,抑或干脆去美國在線 (AOL) 上買點廣告來做推廣?

搜索引擎靠什么活著,不就是廣告嘛?舍不得兒子套不著狼,想賣廣告當然要先買點廣告。我直接把錢全扔在廣告上了。



獲得了一些用戶,然而剛剛略微提升的品牌聲譽,就因為突然發生的重大安全漏洞而掉下去了。著急忙慌地修完了 bug,我又面臨了選擇商業模式、引入外部投資者、如何拓展分支業務等一連串難題。



當我在這邊焦頭爛額,我的員工卻在上班時間里搗鼓自己的項目,說要做什么「Gmail」。

這怎么行?郵件里怎么賣廣告?不是跟我的核心模式背道而馳了嗎?直接解雇他,必須 all in 搜索。



到了 2005 年,谷歌收購了 Android。

這妨礙了我專心賣網站廣告,但移動互聯網的浪潮確實不可抵擋。我們可以繼續在新操作系統里尋找機會植入廣告,聽說有一家中國的手機公司很擅長做這個——我們不跟它合作,也不跟任何公司合作,而是直接自己做自己的手機。

并且要封閉,要垂直整合,要多放廣告。只有圍墻里的花園才是最美麗的花園。我叫它 Nexus。



2006 年,中國互聯網市場也快速增長。

雖然經過一番操作,公司賬上只有 9 萬美元,但我還是決定全面進軍中國市場,擁抱人口紅利。



2011 年,谷歌依舊沒有上市。

看到 Facebook 上市,我沒有心動,而是從微軟招來了一名愛將 Vic Gundotra,授權他全力研發 Google+。我們將 all in 社交媒體!

時間過得飛快,到了 2016 年。谷歌依舊沒有上市。

目前賬上有 8 萬美元——沒虧就是賺。我們做了大量的收并購,特別是一家名叫 DeepMind 的公司,非常火。我決定這次 all in AI。當然,廣告依舊是核心,只是我們不說。



最終,我的 Google CEO 之旅還是結束了。也許我的一系列的操作,導致董事會終于失去了信任。我離開了這家奉獻了 20 多年青春的公司,留下了還不錯的技術實力,少而精的用戶基礎,輕松自由的組織管理文化,以及略高于電詐園區的品牌聲譽。

至少,我們是一家穩健的公司。

剛才的游戲過程,確實多半是我在故意整活。不過這個模擬器雖然很簡單,還是設計很全面的,有劇情,有選項,有資源表,有大事記。作為一個小游戲,一個小品級的產品,它已經很完整了,體現出的想象力很豐富。

然而它只是用 Manus 用一句提示語生成的。

Google公司運營模擬器,玩家將扮演谷歌ceo,體驗谷歌歷史上重要的公司決策,讓用戶過癮的同時,也能了解谷歌的歷程,啟發用戶思考公司決策,互動式的文字游戲

我們可以通過重放過程看到它的思考、分解任務、執行子項任務、最終匯總和生成結果的全部過程:

Manus 簡單地回答了用戶自己將要做什么,緊接著打開了一個 Ubuntu 虛擬機,直接開始分解具體任務,編寫了一個基于 todo.md 文件的任務清單。



任務被分解為 7 個步驟:
    研究谷歌的歷史背景和關鍵公司決策涉及游戲架構和互動機制根據研究學習的結果,生成一些可選的,符合史實的決策場景構建游戲邏輯以及 UI進行游戲功能和游戲體驗的測試創建一個靜態版本的成品,供用戶部署

首先,Manus 先去做了大量的搜索,包括谷歌創始人/CEO 是誰,歷史上的關鍵產品,重要的收購紀錄以及近年來的商業模式和戰略轉變等大量的資料,并且瀏覽了包括谷歌官網、維基百科、中英文新聞網站、知乎等等。

通過這些資料的學習,Manus 對谷歌已經有了一個八九不離十的認識,可能并不深度,并不獨到,倒也沒有太多事實出入。

而如果用戶覺得它自動搜索的資料不夠全面,想加一點獨特的味道,完全可以做到:

在執行過程中,用戶隨時點擊這個按鈕,手動增加知識內容。Manus 在生成的過程中,依舊會時不時回來復習一下這些資料。





在執行任務的每一步驟,Manus 也都會用正確的語言(中文完全支持),向用戶解釋自己剛才做了什么,獲得了哪些收獲,而接下來要做什么。這應該歸功于它在分解任務時候做的類似于 to-do list 一樣的文件。

它的表述也是結構化,有邏輯的,力求向你完整展示它的思考方式。

這顯示 Manus 很聰明。但值得注意的是,任何一個缺乏專業能力的用戶——特別是 Manus 目前所體現出的數據挖掘、整理,以及編程等能力——也能夠通過觀察 Manus 工作流程來提升自己。

重要的不只是結果,還有過程。

澤連斯基-特朗普吵架模擬器


大家都在吐槽澤連斯基在白宮表現糟糕,但你上你行嗎?不要光說不練,來試試這款 Manus 官方測試的小游戲:澤連斯基白宮辯論模擬器!



輸入提示是這樣的:

中文:最近,澤連斯基、萬斯和特朗普在白宮的激烈交鋒引起了廣泛關注。你能否開發一個簡單的互動模擬游戲,讓我在辯論中扮演澤連斯基?我對能再現這一政治場景的互動游戲很感興趣。

原文:The recent heated exchanges between Zelenskyy, Vance, and Trump at the White House have garnered significant attention. Could you develop a simple interactive simulation that allows me to role-play as President Zelenskyy during those debates? I’m interested in an engaging interactive game that recreates this political scenario.

任務總共分為 9 步:
    研究三人之間的互動設計文字游戲的架構以及游戲機制創建了一個 Next.js 應用來模擬辯論環節開發一個對話系統,填充對話腳本創建用戶界面進行全面的模擬測試【用戶接管】將游戲部署到虛擬機,供用戶測試制作用戶手冊,交付將完成品部署到公開 URL 上,供永久使用

直到玩家測試步驟,之前的全部工作都由 Manus 在虛擬機上自動完成,不需要用戶做出任何控制。同樣,在任務的關鍵節點上,Manus 都會特別解釋自己做了什么。

這種「可解釋性」很關鍵,能夠降低 AI 工具的「黑盒」感。



Manus 介紹,自己設計了三種結局,在游戲結束后會給玩家提供一份完整記錄。游戲過程中有強硬 (assertive)、外交 (diplomatic)、安撫 (conciliatory) 這三種對話選項供玩家選擇,NPC 會對不同風格的表述產生不同的「情緒」,直接影響結局走向。

而這正是《天國拯救》、《巫師》等游戲最流行的設計理念:choose your own adventure,選擇你自己的冒險。

在我的試玩中,我嘗試代入了一個身處政治外交和軍事漩渦的政治家,在家國被割據的屈辱,和國際政治談判舞臺所期待的外交身段之間,試圖在刀尖上找平衡。

我兩度導致特朗普失望和遭到萬斯的懷疑,但所幸在特朗普的最后通牒時刻,還是把場面救回來了。雖然我的談判沒有達成直接的實質性的結果,至少我沒被轟出白宮……

如果用官方外交辭令來講,那應該就是「交換了意見,會談是有益的」。



雖然只有 6 個回合,因為可選項設計的有意思,劇情多樣,我又玩了幾次。可能因為性格太懦弱,有一次甚至談成了。

一個純文字游戲,還真玩出了點 RPG 的代入感。

你可以在 Manus 官網的Use Cases – WTF 一欄,找到這個模擬游戲。跑完會話回放之后,在它的最后一條回復里面找到游戲的鏈接。或者你也可以直接訪問這個地址:https://dgooezit.manus.space/

體驗總結:拒絕「高潮」,好玩好用就已足夠


從 Manus 發布,爆紅,到現在一碼難求,網站登陸訪問困難,團隊對外道歉,只用了十幾個小時的時間。

APPSO 在 Manus 發布之初就做了報道,給了一個相對正面的評價。而經過了更加深入的試玩,我們提煉出這個產品的優點:

首先,Manus 的用戶界面,讓用戶可以直接觀察它的思考路徑和工作流程。

無論在使用過程中,還是事后重放,都能夠比較完整地展示模型是如何思考的,任務是怎樣被拆解和指派的,每一個步驟都可以追溯。

這即是一種提高 AI 可解釋性的實踐,同時也給用戶一個通過模仿它來自我提升長大的機會。

其次,它不僅具備處理復雜工作的能力,同時還能保持更高的自動化水平。

最直觀的例子就是 Manus 官方做的人力資源任務——篩選簡歷。

Manus 結合 computer use 能力打開虛擬機,解壓用戶上傳壓縮包,遍歷 25 份簡歷,提取并記憶 25 組復雜信息;再將它們整理到一個 Excel 表格當中,進行打分排名,充分列舉了包括資歷、技能水平、項目經驗、關鍵成就在內的多個指征,卻不單獨依賴特定一項。



在過去,同類的工作在過去可能需要用戶用一個 AI Agent 工具,多次分步輸入指令,或者需要用戶自己用多個工具來分別完成任務再自行組合,無論怎么做都很麻煩。而 Manus 的自動化程度,超過了包括 Claude 在內的同類方案。就算你堅信 Manus 的能力沒什么過人之處(畢竟套殼),但不可否認它的體驗是更優秀的。

綜上各點,Manus 確實超過了過去一段時間以來我們對 AI 工具的體驗認知。如果說以前的 Agent 更多只是沒「腦子」的工具,Manus 已經非常接近一個有「腦子」的 AI 助手,從人機互動升格為人機協作。

但與此同時,我們今天看到了不少過分吹捧的自媒體報道,跟著 Manus 團隊一起提前「高潮」了,稱其「AGI 的里程碑」;當然,也不乏有人指出其產品「套殼」,團隊人物存在「黑歷史」,技術棧和實現方式缺乏真正的自主創新。

我們應該批評 Manus 什么?毫無疑問,它的營銷方式并不「體面」:找了一批自媒體來做內部分享,號稱「只是發一個 demo」,以沒準備好應對用戶爆炸的服務器資源為說辭,制造一種營銷的「高潮」,隨后又對外界封鎖,使得人們難以探知真相,滿足好奇心。

但我想,無論這個產品以公測還是正式發布的方式,向公眾完全開放之前,一切的維護和貶損都沒有太大意義。

AI 技術突飛猛進,早已離開了學術科研的襁褓,和大公司的封鎖。企業航母 all in AI 難保一帆風順,小公司卻完全可以只用一周時間起飛。現有的開源、半公開,付費、收費的工具比比皆是,只要不違反相應的開源許可證規則和商業授權協議,任何人都可以充分且自由地利用它們,無論出于純粹的個人使用,還是做拼裝組合疊加的「套殼」式創新。

更別提這個「創新」的結果還挺好玩(就算拿不到邀請碼,你也可以去網站上感受幾十個現成的 use cases)。

好玩的東西,在這個時代太稀缺了。腦洞誰都能開,填的上才是王道。

我們擁抱創新,關注和欣賞那些好玩有趣的東西。對于可能定義我們未來數字生活的產品,我們的包容并不廉價,但絕對足夠。

#歡迎關注愛范兒官方微信公眾號:愛范兒(微信號:ifanr),更多精彩內容第一時間為您奉上。

愛范兒|原文鏈接· ·新浪微博
分享到:
您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規則

交流熱線
17501437970 周一至周日:09:00 - 21:00

創贏網-致力于幫助普通人在創業之路上披荊斬棘、走向成功的專業網站,匯聚創新智慧與成功機遇的網絡天地,是創業者開啟贏之征程的首選之地。

Powered by Discuz! X3.5 © 2023-2050 CHUANYING Team.

QQ|Archiver|手機版|小黑屋|創贏網 ( 湘ICP備17022177號-3 )

GMT+8, 2025-5-20 19:35 , Processed in 0.398793 second(s), 30 queries .

快速回復 返回頂部 返回列表
主站蜘蛛池模板: 欧美另类视频在线| 欧美国产一区二区三区| 在线播放国产精品| 日韩精品欧美| 日韩色在线| 欧美激情亚洲激情| 日韩女同互慰一区二区| 激情999| 成人欧美一区二区三区| 女人一级毛片| www在线播放| 久久亚洲精品中文字幕| 男人草女人视频| 日本欧美在线观看| 国产精品一区三区| 日韩精品在线一区二区| 亚洲一区不卡| 男人的天堂在线视频| 亚洲三及| 国产在线观看不卡| 在线免费观看黄色| 九九精品在线观看| 亚洲精品乱码久久久久| 国产免费视频| 91久操| 玖玖精品| 欧美国产二区| 国产啪在线| 欧美日韩激情一区| 中文字幕欧美激情| 久国产精品| 国产一级片在线播放| 正在播放一区| 国产网站在线免费观看| 亚洲欧洲日本在线| 99久久99| 亚洲精品视频在线| 日韩专区视频| 国产综合第一页| 毛片网站大全| 99热这里有精品|