Tag: 大模型

雲知聲Unisound U1-OCR大模型發布!首個工業級文件智慧基礎大模型,開啟OCR 3.0時代

北京2026年2月26日 /美通社/ — 就在剛剛,雲知聲正式推出「Unisound U1-OCR」 文件智慧基礎大模型。作為首個工業級文件智慧基座,該模型憑借 「效能 SOTA、可信可驗、開箱即用、高效部署、強適配」 五大核心優勢,打破傳統文件處理邊界,樹立起行業新標杆。 一、技術跨越:從 OCR 2.0 邁向 3.0 文件智慧(Document Intelligence)是指利用人工智慧技術自動閱讀和理解文件影像,並進行內容的讀取、理解、分類及關鍵資訊提取。傳統視覺方案(OCR 1.0,以 CRNN 為代表)僅能識別文字,新一代多模態方案(OCR 2.0,以VLM為代表 )具備初步版面理解能力。而 「Unisound U1-OCR」 則正式開啟 OCR 3.0 時代——在理解版面的基礎上,進一步洞察文件深層語義,實現自動分類與業務級資訊抽取,完成了從「字元感知」到「文件認知」的質的飛躍。 二、實力領跑:多項權威評測穩居全球第一梯隊 「Unisound U1-OCR」是一款達到國際頂尖水平(SOTA)的文件智慧理解模型,其核心優勢在於突破了傳統模型「只讀文字、不懂排版」的瓶頸,能夠像人類專家一樣「看懂」複雜文件。為適應…

明略科技發布大模型產品線 DeepMiner,打造商業資料分析可信智慧體

北京2025年10月6日 /美通社/ — 近日,中國企業級大模型與資料智慧領軍企業——明略科技正式推出專有大模型產品線DeepMiner。該產品線定位於商業資料分析,旨在透過可信的智慧體,為企業提供更高效、可驗證的資料處理和決策支援能力。 The Introduction of DeepMiner 明略科技創始人、CEO兼CTO吳明輝表示,人工智慧的發展已逐步進入以智慧體為核心的新階段。與面向消費者的「一句話生成」類應用不同,企業在生產環境中更關注結果的準確性和可追溯性。DeepMiner的推出,正是為了滿足企業級場景對透明度和可靠性的需求。 據瞭解,DeepMiner採用多智慧體架構(MoA),可針對每個細分業務板塊,匹配最優模型進行處理,相較於MoE架構,大幅提升了系統最佳化效率;從任務分解、工具呼叫到結果生成,使用者均可清晰檢視每一步操作的邏輯,在必要時還可透過人機互動機制,隨時人工幹預,不僅大幅降低了「幻覺」發生率,更讓輸出結果具備了可驗證性;此外,模型深度整合廣告、零售、電商等商業領域資料庫,確保智慧體分析資料的真實性與全面性,從源頭規避AI幻覺 。經實際測試,DeepMiner在垂直行業場景中的「幻覺」率遠低於通用模型水平。 技術方面,DeepMiner由智慧中樞——Foundation Agent統一排程,承擔起各元件協同工作的統籌職責。Cito模型作為DeepMiner的分析決策中樞,專為深度推理而設計,它能為復雜商業問題動態構建專業推理鏈路,利用人機協作縮小動作空間,提高任務執行的效率和準確率;Mano模型作為DeepMiner的自動化執行引擎,讓智慧體真正學會了「看」與 「點」, 能夠在復雜的軟體與瀏覽器環境下實現精細化操作。透過Foundation Agent的統一排程,DeepMiner可以將Cito的深度推理規劃能力與Mano的精準執行能力深度融合,從而打通從「商業洞察」到「業務執行」的端到端智慧自動化閉環。 明略科技DeepMiner產品負責人黃楠介紹,人工智慧從生成式 AI(Generative AI)發展到 智慧體AI(Agentic AI)最大的突破在於,Agent給大模型安裝了眼睛和手腳,能夠主動執行任務。其精準的工具呼叫能力,依賴於Browser Use Agent(BUA)與 Computer Use Agent(CUA)效能。然而,通用大模型並非為操作軟體而訓練,因此在復雜商業場景的規劃、操作效果往往差強人意。明略科技自研的Mano模型透過持續強化學習,能夠自主探索並適應全新的平臺與業務流程,在實際業務場景上盡顯優勢。目前,Man已登頂全球兩大權威基準測試——Mind2Web、OSWorld,均達到SOTA(State of the Art)水平。 明略科技創始人、CEO兼CTO吳明輝表示:「可信是企業應用AI的核心標準,而DeepMiner…

全球雙榜SOTA!明略科技專有大模型 Mano開啟GUI智慧操作新時代

北京2025年10月6日 /美通社/ — 2025年,Agent無疑是AI圈的熱詞。行業普遍認為:真正有用的Agent,必須學會使用手機和電腦,像人一樣操作GUI。 近日,中國企業級大模型與資料智慧企業——明略科技推出的專有GUI大模型 Mano在行業公認的Mind2Web和OSWorld兩大基準測試中,均取得了創紀錄的SOTA成績。透過線上強化學習和訓練資料自動採集兩大核心創新,Mano為GUI智慧體領域提供了一套可擴充套件、可持續進化的新正規化。 Mano在OSWorld-Verified榜單的Foundation E2E GUI & Specialized Model評測中取得SOTA。 榜單連結:https://os-world.github.io/技術報告連結:https://www.mininglamp.com/news/6394/ 關鍵突破: 1.Mind2Web:Mind2Web覆蓋137個網站、2350+真實任務,旨在考察智慧體能否在複雜多變的DOM結構裡精準找到目標元素,並完成整個操作鏈。Mano展示出「看得準、做得成」的核心優勢。 技術報告顯示,Mano的元素精度 (Ele.Acc)和步驟成功率(Step SR)指標遙遙領先,在準確識別、定位介面元素,以及成功執行多步任務能力上達到新高度。Mano的操作F1 (Op.F1) 指標與此前頂尖模型持平甚至略高,能夠真正將複雜任務轉化為成功的操作序列。 2. OSWorld-Verified:更難的挑戰來自桌面端。OSWorld-Verified涵蓋了369個跨應用任務,覆蓋10類應用,包含瀏覽器,辦公軟體等多個型別,每一個操作都和真實桌面場景無縫對接。 技術報告顯示,在OSWorld-Verified榜單的Foundation E2E GUI & Specialized Model 評測中,Mano直接把成功率提升到 41.6±0.7%,超過qwen、GUI-Owl、opencua等模型。…