AI项目框架 | 第51页

FlipSketch – 萨里大学推出的文本引导生成无约束草图动画的AI系统

FlipSketch 是萨里大学推出的创新系统，能将静态绘图转变为文本引导的草图动画。技术基于三个关键创新实现：微调草图风格的帧生成、用噪声细化保持输入草图视觉完整性的参考帧机制，及在不失去视觉一致性...

AI项目框架 #

5个月前

000

DELIFT – 数据高效语言模型指令微调算法

DELIFT（Data Efficient Language model Instruction Fine-Tuning）是新型算法，用在优化大型语言模型（LLMs）在指令调优、任务特定微调和持续微调...

AI项目框架 # # AI

5个月前

000

HART – 麻省理工学院推出的自回归视觉生成模型

HART（Hybrid Autoregressive Transformer）是麻省理工学院研究团队推出的自回归视觉生成模型。能直接生成1024×1024像素的高分辨率图像，质量媲美扩散模型。HART...

AI项目框架 #

5个月前

090

Kandinsky-3 – 开源的文本到图像生成框架，适应多种图像生成任务

Kandinsky-3是基于潜在扩散模型的文本到图像（T2I）生成框架，以高质量和逼真度在图像合成领域脱颖而出。Kandinsky-3能适应多种图像生成任务，包括文本引导的修复/扩展、图像融合、文本...

AI项目框架 # # AI

5个月前

060

WebDreamer – 基于大语言模型模拟网页交互增强网络规划能力的框架

WebDreamer是俄亥俄州立大学和Orby AI研究团队推出的基于模型规划的网络智能体，基于大型语言模型（LLMs），特别是GPT-4o，作为世界模型预测网站上的交互结果。框架模拟可能的用户行为和...

AI项目框架 # # AI

5个月前

000

Flex3D – Meta GenAI和牛津大学共同推出的两阶段3D生成框架

Flex3D是由Meta的GenAI团队和牛津大学研究团队推出的创新的两阶段3D生成框架，能基于任意数量的高质量输入视图，解决从文本、单张图片或稀疏视图图像生成高质量3D内容的挑战。第一阶段，基于微调...

AI项目框架 # # AI

5个月前

060

CAVIA – 苹果、得克萨斯、谷歌联合推出的多视角视频生成框架

CAVIA是苹果公司、得克萨斯大学奥斯汀分校、谷歌联合推出的多视角视频生成框架，能将单一输入图像转换成多个时空一致的视频序列。框架基于引入视角集成注意力模块，增强视频的视角一致性和时间连贯性，支持用户...

AI项目框架 #

5个月前

010

EvolveDirector – 阿里联合南洋理工推出文本到图像生成模型的高效训练技术

EvolveDirector是阿里巴巴和南洋理工大学联合推出的创新框架，用公开资源和高级模型的API接口训练一个高性能的文本到图像生成模型。框架基于与现有高级模型的API交互获取数据对，训练一个基础模...

AI项目框架 #

5个月前

000

MCP – Anthropic 开源的模型上下文协议

MCP（Model Context Protocol，模型上下文协议）是一个开放协议，是Anthropic开源的，能实现大型语言模型（LLM）应用与外部数据源和工具之间的无缝集成。基于客户端-服务器架...

AI项目框架 # # AI

5个月前

040

LEOPARD – 腾讯AI Lab西雅图实验室推出的视觉语言模型

LEOPARD是腾讯AI Lab西雅图实验室推出的视觉语言模型，专为理解和处理含有大量文本的多图像任务设计。LEOPARD基于两个主要技术创新：一是策划约一百万条专门针对文本丰富、多图像场景的高质量多...

AI项目框架 # # AI

5个月前

020