• <li id="v9jmt"><meter id="v9jmt"><th id="v9jmt"></th></meter></li>
    <label id="v9jmt"></label>

        #Ai應用

        AI目前主要應用在哪些領域?AI應用非常廣泛,只要有 語音識別,圖像識別,自然語言處理,智能安防, 智能家居,人工智能醫療,金融智能,智能交通等。

        最新AI應用

        我們收集優秀的論文查重、潤色論文和論文網站等AI人工智能論文寫作網站,幫助學術界和學生們提高論文質量和學術水平,論文寫作效率。


        Replicate
        Replicate

        在線運行開源機器學習模型

        Evidently AI
        Evidently AI

        開源的機器學習模型監測和測試工具

        MMLU
        MMLU

        MMLU 全稱 Massive Multitask Language Understanding,是一種針對大模型的語言理解能力的測評,是目前最著名的大模型語義理解測評之一,由UC Berkeley大學的研究人員在2020年9月推出。

        Open LLM Leaderboard
        Open LLM Leaderboard

        Open LLM Leaderboard 是最大的大模型和數據集社區 HuggingFace 推出的開源大模型排行榜單,基于 Eleuther AI Language Model Evaluation Harness(Eleuther AI語言模型評估框架)封裝。

        C-Eval
        C-Eval

        C-Eval是一個適用于大語言模型的多層次多學科中文評估套件,由上海交通大學、清華大學和愛丁堡大學研究人員在2023年5月份聯合推出,包含了13948個多項選擇題,涵蓋了52個不同的學科和四個難度級別,用以評測大模型中文理解能力。

        FlagEval
        FlagEval

        FlagEval(天秤)由智源研究院將聯合多個高校團隊打造,是一種采用“能力—任務—指標”三維評測框架的大模型評測平臺,旨在提供全面、細致的評測結果。

        SuperCLUE
        SuperCLUE

        SuperCLUE 是一個中文通用大模型綜合性評測基準,從三個不同的維度評價模型的能力:基礎能力、專業能力和中文特性能力。

        OpenCompass
        OpenCompass

        OpenCompass是由上海人工智能實驗室(上海AI實驗室)于2023年8月正式推出的大模型開放評測體系,通過完整開源可復現的評測框架,支持大語言模型、多模態模型各類模型的一站式評測,并定期公布評測結果榜單。

        CMMLU
        CMMLU

        CMMLU是一個綜合性的中文評估基準,專門用于評估語言模型在中文語境下的知識和推理能力,涵蓋了從基礎學科到高級專業水平的67個主題。

        MMBench
        MMBench

        MMBench是一個多模態基準測試,該體系開發了一個綜合評估流程,從感知到認知能力逐級細分評估,覆蓋20項細粒度能力,從互聯網與權威基準數據集采集約3000道單項選擇題。打破常規一問一答基于規則匹配提取選項進行評測,循環打亂選項驗證輸出結果的一致性,基于ChatGPT精準匹配模型回復至選項。

        HELM
        HELM

        HELM是由斯坦福大學推出的大模型評測體系,該評測方法主要包括場景、適配、指標三個模塊,每次評測的運行都需要指定一個場景,一個適配模型的提示,以及一個或多個指標。

        Chatbot Arena
        Chatbot Arena

        Chatbot Arena是一個大型語言模型 (LLM) 的基準平臺,以眾包方式進行匿名隨機對戰,該項目方LMSYS Org是由加州大學伯克利分校、加州大學圣地亞哥分校和卡內基梅隆大學合作創立的研究組織。

        LLMEval3
        LLMEval3

        LLMEval是由復旦大學NLP實驗室推出的大模型評測基準,最新的LLMEval-3聚焦于專業知識能力評測,涵蓋哲學、經濟學、法學、教育學、文學、歷史學、理學、工學、農學、醫學、軍事學、管理學、藝術學等教育部劃定的13個學科門類、50余個二級學科,共計約20W道標準生成式問答題目。

        H2O EvalGPT
        H2O EvalGPT

        H2O EvalGPT 是 H2O.ai 用于評估和比較 LLM 大模型的開放工具,它提供了一個平臺來了解模型在大量任務和基準測試中的性能。無論你是想使用大模型自動化工作流程或任務,H2O EvalGPT 都可以提供流行、開源、高性能大模型的詳細排行榜,幫助你為項目選擇最有效的模型完成具體任務。

        PubMedQA
        PubMedQA

        PubMedQA是一個生物醫學研究問答數據集,包含了1K專家標注,61.2K 個未標注和 211.3K 個人工生成的QA實例,該排行榜目前已收錄18個模型的醫學測試得分。

        酷表ChatExcel
        酷表ChatExcel

        北大團隊開發的通過聊天來操作Excel表格的AI工具

        Ajelix
        Ajelix

        處理Excel和Google Sheets表格的AI工具

        Sheet+
        Sheet+

        Excel和Google Sheets表格AI處理工具

        ExcelFormulaBot
        ExcelFormulaBot

        AI將指令轉換成Excel的函數公式

        FormX.ai
        FormX.ai

        AI自動從表格和文檔中提取數據

        四虎影视永久地址四虎影视永久地址www成人| 亚洲日韩国产欧美一区二区三区| 老师粗又长好猛好爽视频| 国产在线无码视频一区二区三区| 18亚洲男同志videos网站| 国产福利不卡视频| 高清欧美一级在线观看| 国产成人vr精品a视频| 色婷婷亚洲十月十月色天| 国产一区二区三区国产精品| 色五月在线视频| 国产91精品久久久久久| 男的把j伸进女人p图片动态| 四虎影视在线永久免费观看| 篠田优在线播放| 啊灬啊灬别停啊灬用力啊免费 | 亚洲精品午夜国产va久久成人| 渣男渣女抹胸渣男渣女app| 亚洲高清中文字幕综合网| 波多野结衣女教师6bd| 免费看**一片毛片| 正在播放西川ゆい在线| 伊人久久精品无码麻豆一区| 男人j进女人p免费动态图| 人人爽天天碰天天躁夜夜躁| 欧美在线视频二区| 亚洲欧美一区二区三区图片| 最色网在线观看| 久久婷婷成人综合色| 日本zzzzwww大片免费| 久久精品久噜噜噜久久| 日本卡一卡二新区| 久久精品九九亚洲精品| 性满足久久久久久久久| www视频在线观看| 国产精品无码专区在线播放| 高h视频免费观看| 国产a毛片高清视| 精品国自产拍天天拍2021| 免费人成年激情视频在线观看| 波霸影院一区二区|