fast.ai:免费开源的深度学习和AI学习网站,让每个人都参与到AI! | AI工具集 深度学习正在改变世界,而fast.ai项目便致力于让深度学习更容易使用。该深度学习和AI学习网站提供了一系列免费的AI学习资源和课程:针对程序员的免费AI课程、软件库、前沿研究以及AI社区。 0130 AI写作工具
腾讯扣叮 - 腾讯推出的青少年编程教育平台 | AI工具集 腾讯扣叮是腾讯推出的青少年编程教育平台。基于腾讯在游戏和AI领域的技术优势,为6至18岁的孩子们提供有趣、互动的学习环境,在数字世界中探索和学习编程。 0460 AI写作工具
PubMedQA - 生物医学研究问答数据集和模型得分排行榜 | AI工具集 PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K 个未标注和 211.3K 个人工生成的QA实例,该排行榜目前已收录18个模型的医学测试得分。 0140 AI写作工具
H2O EvalGPT - H2O推出的基于Elo评级方法的LLM评估系统和工具 | AI工具集 H2O EvalGPT 是 H2O.ai 用于评估和比较 LLM 大模型的开放工具,它提供了一个平台来了解模型在大量任务和基准测试中的性能。无论你是想使用大模型自动化工作流程或任务,H2O EvalGPT 都可以提供流行、开源、高性能大模型的详细排行榜,帮助你为项目选择最有效的模型完成具体任务。 0110 AI写作工具
LLMEval3 - 由复旦大学NLP实验室推出的大模型评测基准 | AI工具集 LLMEval是由复旦大学NLP实验室推出的大模型评测基准,最新的LLMEval-3聚焦于专业知识能力评测,涵盖哲学、经济学、法学、教育学、文学、历史学、理学、工学、农学、医学、军事学、管理学、艺术学等教育部划定的13个学科门类、50余个二级学科,共计约20W道标准生成式问答题目。 0120 AI写作工具
Chatbot Arena - 以众包方式进行匿名随机对战的LLM基准平台 | AI工具集 Chatbot Arena是一个大型语言模型 (LLM) 的基准平台,以众包方式进行匿名随机对战,该项目方LMSYS Org是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学合作创立的研究组织。 070 AI写作工具
HELM - 斯坦福大学推出的大模型评测体系 | AI工具集 HELM是由斯坦福大学推出的大模型评测体系,该评测方法主要包括场景、适配、指标三个模块,每次评测的运行都需要指定一个场景,一个适配模型的提示,以及一个或多个指标。 0130 AI写作工具
MMBench - 全方位的多模态大模型能力评测体系 | AI工具集 MMBench是一个多模态基准测试,该体系开发了一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20项细粒度能力,从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测,循环打乱选项验证输出结果的一致性,基于ChatGPT精准匹配模型回复至选项。 0790 AI写作工具
CMMLU - 一个综合性的大模型中文评估基准 | AI工具集 CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力,涵盖了从基础学科到高级专业水平的67个主题。 0140 AI写作工具
OpenCompass - 上海人工智能实验室推出的大模型开放评测体系 | AI工具集 OpenCompass是由上海人工智能实验室(上海AI实验室)于2023年8月正式推出的大模型开放评测体系,通过完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测,并定期公布评测结果榜单。 0360 AI写作工具
SuperCLUE - 中文通用大模型综合性测评基准 | AI工具集 SuperCLUE 是一个中文通用大模型综合性评测基准,从三个不同的维度评价模型的能力:基础能力、专业能力和中文特性能力。 0430 AI写作工具
FlagEval - 智源研究院推出的FlagEval(天秤)大模型评测平台 | AI工具集 FlagEval(天秤)由智源研究院将联合多个高校团队打造,是一种采用“能力—任务—指标”三维评测框架的大模型评测平台,旨在提供全面、细致的评测结果。 0130 AI写作工具
C-Eval:一个全面的中文基础模型评估套件 | AI工具集 C-Eval是一个适用于大语言模型的多层次多学科中文评估套件,由上海交通大学、清华大学和爱丁堡大学研究人员在2023年5月份联合推出,包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,用以评测大模型中文理解能力。 0350 AI写作工具
Open LLM Leaderboard - HuggingFace推出的开源大模型排行榜单 | AI工具集 Open LLM Leaderboard 是最大的大模型和数据集社区 HuggingFace 推出的开源大模型排行榜单,基于 Eleuther AI Language Model Evaluation Harness(Eleuther AI语言模型评估框架)封装。 0150 AI写作工具
MMLU - 大规模多任务语言理解基准,UC Berkeley推出 | AI工具集 MMLU 全称 Massive Multitask Language Understanding,是一种针对大模型的语言理解能力的测评,是目前最著名的大模型语义理解测评之一,由UC Berkeley大学的研究人员在2020年9月推出。 0310 AI写作工具
ChatGPT Shortcut: 开源的简单易用的ChatGPT快捷指令,让生产力加倍! | AI工具集 ChatGPT Shortcut是国内开发者推出的ChatGPT提示指令的开源项目,让你使用ChatGPT的生产力加倍,按照领域和功能分区,可对提示词进行标签筛选、关键词搜索和一键复制。 0140 AI写作工具
绘AI - AI绘画提示词分享平台 | AI工具集 绘AI致力于探索和创造一种全新的AI提示词创作成果展示和赚取收益的方式,以AI画师上传的优秀AI绘画提示词作为核心内容,为全国AI画师用户搭建共享共赢的提示词分享交流平台,让热爱AI绘画的画师们聚集在一起,创造更多的价值。 0190 AI写作工具
Snack Prompt:探索最新的ChatGPT语义提示词 | AI工具集 输入正确的提示词,可以让ChatGPT生成更好的结果,使用Snack Prompt可以帮助你解锁人工智能的潜力,优化你的ChatGPT体验。在Snack Prompt社区,用户可以访问每天新鲜出炉的大量热门提示词库: 0180 AI写作工具
LangGPT - 编写高质量的提示词(Prompt)的开源工具 | AI工具集 LangGPT是一种新型的提示词设计工具,提出了一种结构化和可复用的提示词编写方法论,帮助用户编写高质量的提示词。工具受到编程语言的启发,设计了双层结构的提示设计框架,易于学习和应用。 0180 AI写作工具
AI Short - AI提示词管理和共享平台,多种场景的快捷指令 | AI工具集 AI Short是一个AI提示词管理和共享平台,通过提供标签筛选、关键词搜索和一键复制提示词的功能,帮助用户提升与AI对话的效率和质量。用户可以在这个平台上找到适合不同场景的提示词,无论是工作、学习还是创意写作,通过优化的提示词获得更精确、实用的反馈,有效提升生产力。 0380 AI写作工具