Crack Coder – AI技术面试工具,提供实时编程问题支持 Crack Coder 是开源的隐形 AI 辅助工具,专为技术面试设计。Crack Coder支持在后台运行,完全隐形,无法被屏幕录制或监控软件检测到。Crack Coder提供实时 AI 编程辅助... AI项目框架 4周前020
YT Navigator – AI YouTube 内容搜索工具,自然语言查询定位关键信息 YT Navigator 是 AI 驱动的 YouTube 内容搜索工具,帮助用户高效地搜索和浏览 YouTube 频道内容。YT Navigator自然语言查询功能,让用户快速定位到特定频道视频中的... AI项目框架# # AI 4周前040
Step-Video-TI2V – 阶跃星辰开源的图生视频模型 Step-Video-TI2V 是阶跃星辰(StepFun)推出的开源图生视频(Image-to-Video)生成模型,拥有 300 亿参数,能根据文本描述和图像输入生成最长 102 帧的视频。模型基... AI项目框架 4周前020
Dify-Plus – 基于 Dify 二次开发的企业级增强版项目 Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,集成基于 gin-vue-admin 的管理中心。Dify-Plus在 Dify 基础上新增用户额度、密钥额度、Web 公开页登录鉴权... AI项目框架# 4周前020
GPT-4o mini TTS – OpenAI 推出的文本转语音模型 GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型,支持将文本内容转换为自然流畅语音的同时,开发者能用指令控制语音的语调、情感和风格,例如“平静”“鼓励”“严肃”等,适应不同... AI项目框架 4周前020
gpt-4o-transcribe – OpenAI 推出的语音转文本模型 gpt-4o-transcribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构,用海量多样化音频数据训练,精准捕捉语音细微差别,显著降低单词错误率(WER),优于前代 Whis... AI项目框架# # AI 4周前050
gpt-4o-mini-transcribe – OpenAI 推出的语音转文本模型 gpt-4o-mini-transcribe 是 OpenAI 推出的语音转文本模型,gpt-4o-transcribe的精简版。gpt-4o-mini-transcribe 基于 GPT-4o-mi... AI项目框架 4周前020
MSQA – 大规模多模态3D情境推理数据集 MSQA(Multi-modal Situated Question Answering)是大规模多模态情境推理数据集,提升具身AI代理在3D场景中的理解与推理能力。数据集包含251K个问答对,覆盖9... AI项目框架# # AI 3个月前070
Chonkie – RAG文本分块库,基于Token、单词、句子和语义的多种分块方法 Chonkie是轻量级、快速且功能丰富的RAG(Retrieval-Augmented Generation)分块库,为文本处理设计。Chonkie支持基于Token、单词、句子和语义的多种分块方法... AI项目框架# 3个月前0110
RMBG-2.0 – 开源的图像背景移除模型,支持各类图像高精度背景移除 RMBG-2.0是BRIA AI推出的最新开源图像背景移除模型,基于先进的AI技术实现高精度的前景与背景分离,达到SOTA(State of the Art,即当前最佳)水平。RMBG-2.0在性能上... AI项目框架# # AI 3个月前000