AI项目框架 | 第4页

MyTimeMachine – AI个性化面部年龄转换技术，实现20至40年的时间跨度

MyTimeMachine（MyTM）是先进的个性化面部年龄转换技术，基于大约50张个人照片，跨越20至40年的时间跨度，训练一个适配器网络个性化预训练的全局老化模型。MyTimeMachine能实现...

AI项目框架 #

6个月前

0290

3D-Speaker – 阿里通义推出的多模态说话人识别任务开源项目

3D-Speaker是阿里巴巴通义实验室语音团队推出的多模态开源项目，基于结合声学、语义、视觉信息，实现高精度的说话人识别和语种识别。3D-Speaker提供工业级模型、训练和推理代码，及大规模多设备...

AI项目框架 #

6个月前

0290

Symphony Creative Studio – TikTok推出的AI广告创意视频生成工具

Symphony Creative Studio是TikTok推出的AI视频创作工具，帮助广告主和内容创作者简化视频制作流程。Symphony Creative Studio集成视频生成、转换和扩展功...

AI项目框架 # # AI

6个月前

0280

Illustrious – 开源文本到图像生成模型，专注于生成高质量动漫风格图像

Illustrious是开源的文本到图像动漫图像生成模型，是Onoma AI Research推出的。基于优化批量大小、dropout控制、训练图像分辨率和多级标题等关键方法，实现高分辨率、动态色域和...

AI项目框架 # # AI

6个月前

0280

ORMBG – 开源的AI图像分割工具

ORMBG是开源的AI图像分割工具，由开发者schirrmacher在GitHub上发起。ORMBG专注于从图片中准确去除背景，用先进的图像处理技术，实现对图像中前景和背景的精确区分，常用于照片编辑...

AI项目框架 # # AI

8个月前

0270

App Intents – 苹果推出的集成Siri和Apple Intelligence新框架

App Intents是苹果推出的支持开发者在iOS、macOS等平台上集成Siri和Apple Intelligence的新框架，实现应用功能与系统体验（如Siri、Spotlight搜索、快捷指令...

AI项目框架 #

8个月前

0270

NodeTool – AI工作流可视化构建器，拖放节点设计复杂工作流

NodeTool是开源的AI工作流可视化构建器。NodeTool集成广泛的AI工具和模型，基于简单、可视化的界面，让用户无需编码即可快速原型设计和测试。NodeTool支持在本地GPU上运行AI模型...

AI项目框架 # # AI # 导出

6个月前

0260

Text Behind Image – 开源在线图像处理工具，在图中角色背后添加文字

Text Behind Image是开源的在线工具，支持用户在图片中的角色背后添加文字，创建具有视觉冲击力的海报和社交媒体图像。用户在图像中的主体背后添加自定义文本，并提供文字、字体、颜色、位置、粗细...

AI项目框架 #

6个月前

0250

ebook2audiobookXTTS – 开源电子书转有声书 AI 工具，支持16种语言

ebook2audiobookXTTS是开源的AI工具，能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式，如epub、pdf、mobi等，用Coqui XTTS技术实现...

AI项目框架 # # AI

6个月前

1250

StyleStudio – 文本驱动的风格迁移模型，能将参考图像的风格与文本提示内容融合

StyleStudio是西湖大学AI实验室、复旦大学、南洋理工大学和香港科技大学（广州）联合推出的，文本驱动的风格迁移模型，能将参考图像的风格与文本提示的内容融合。StyleStudio基于三种策略解...

AI项目框架 # # AI

6个月前

0250