MyTimeMachine – AI个性化面部年龄转换技术,实现20至40年的时间跨度 MyTimeMachine(MyTM)是先进的个性化面部年龄转换技术,基于大约50张个人照片,跨越20至40年的时间跨度,训练一个适配器网络个性化预训练的全局老化模型。MyTimeMachine能实现... AI项目框架# 6个月前0290
3D-Speaker – 阿里通义推出的多模态说话人识别任务开源项目 3D-Speaker是阿里巴巴通义实验室语音团队推出的多模态开源项目,基于结合声学、语义、视觉信息,实现高精度的说话人识别和语种识别。3D-Speaker提供工业级模型、训练和推理代码,及大规模多设备... AI项目框架# 6个月前0290
Symphony Creative Studio – TikTok推出的AI广告创意视频生成工具 Symphony Creative Studio是TikTok推出的AI视频创作工具,帮助广告主和内容创作者简化视频制作流程。Symphony Creative Studio集成视频生成、转换和扩展功... AI项目框架# # AI 6个月前0280
Illustrious – 开源文本到图像生成模型,专注于生成高质量动漫风格图像 Illustrious是开源的文本到图像动漫图像生成模型,是Onoma AI Research推出的。基于优化批量大小、dropout控制、训练图像分辨率和多级标题等关键方法,实现高分辨率、动态色域和... AI项目框架# # AI 6个月前0280
ORMBG – 开源的AI图像分割工具 ORMBG是开源的AI图像分割工具,由开发者schirrmacher在GitHub上发起。ORMBG专注于从图片中准确去除背景,用先进的图像处理技术,实现对图像中前景和背景的精确区分,常用于照片编辑... AI项目框架# # AI 8个月前0270
App Intents – 苹果推出的集成Siri和Apple Intelligence新框架 App Intents是苹果推出的支持开发者在iOS、macOS等平台上集成Siri和Apple Intelligence的新框架,实现应用功能与系统体验(如Siri、Spotlight搜索、快捷指令... AI项目框架# 8个月前0270
NodeTool – AI工作流可视化构建器,拖放节点设计复杂工作流 NodeTool是开源的AI工作流可视化构建器。NodeTool集成广泛的AI工具和模型,基于简单、可视化的界面,让用户无需编码即可快速原型设计和测试。NodeTool支持在本地GPU上运行AI模型... AI项目框架# # AI# 导出 6个月前0260
Text Behind Image – 开源在线图像处理工具,在图中角色背后添加文字 Text Behind Image是开源的在线工具,支持用户在图片中的角色背后添加文字,创建具有视觉冲击力的海报和社交媒体图像。用户在图像中的主体背后添加自定义文本,并提供文字、字体、颜色、位置、粗细... AI项目框架# 6个月前0250
ebook2audiobookXTTS – 开源电子书转有声书 AI 工具,支持16种语言 ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式,如epub、pdf、mobi等,用Coqui XTTS技术实现... AI项目框架# # AI 6个月前1250
StyleStudio – 文本驱动的风格迁移模型,能将参考图像的风格与文本提示内容融合 StyleStudio是西湖大学AI实验室、复旦大学、南洋理工大学和香港科技大学(广州)联合推出的,文本驱动的风格迁移模型,能将参考图像的风格与文本提示的内容融合。StyleStudio基于三种策略解... AI项目框架# # AI 6个月前0250