Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
有趣分享
有趣分享

Imgkits 是一款无需安装、直接在浏览器中使用的 AI 图像与视频编辑平台。用户可通过 AI 实现图像生成、照片修复、智能抠图、风格化处理以及文本或图片转视频,适合内容创作者、电商商家、摄影师与社媒运营者进行高效视觉创作。

StableAvatar 是一款开源的音频驱动视频生成模型,通过一张参考图片与音频即可生成自然同步、无限时长的说话或唱歌视频。该项目在音频建模与视频扩散结构上进行了创新,有效解决了长视频生成中常见的身份漂移和口型不同步问题,适合虚拟人、AI 主播、数字分身等应用场景。

Topaz Video AI v7.1.0 是一款基于人工智能的视频画质增强与修复软件,可智能去噪、提升分辨率并修复老旧视频,最高支持 8K 输出,适用于短视频创作、影视修复与专业剪辑场景。

aceFusion(FaceFusion)是一款功能强大的开源 AI 换脸工具,支持高清与 4K 视频处理、唇形同步、多模型增强及多 GPU 加速,广泛应用于影视制作、虚拟主播、短视频创作与 AI 实验开发场景。

Abogen 是一款开源且功能强大的文本转语音(TTS)工具,支持将 PDF、ePub、TXT、Markdown 等文件快速转换为自然流畅的音频,并自动生成时间同步字幕。基于 Kokoro-82M 模型,适合有声书制作、视频配音、播客旁白及 AI 内容创作,是内容创作者非常值得收藏的生产级工具。

FramePack是一款低显存可用的AI图生视频工具,只需一张图片即可生成最长120秒的视频,操作简单、功能强大,适合短视频创作者、电商内容制作及自媒体创作使用,让创作更高效。

Reface 解锁版是一款广受欢迎的 AI 换脸照片应用,支持照片与视频一键换脸、对口型说话和人脸动画生成。无需专业技能,即可快速制作高质量 AI 换脸内容,非常适合普通用户、自媒体创作者和 AI 工具爱好者使用。

阿里巴巴正式发布 Qwen3-4B-Instruct-2507 与 Qwen3-4B-Thinking-2507 两款新模型,主打小参数高性能,原生支持 256K 上下文。本文全面解析两种版本差异、适用场景及部署价值,适合 AI 开发者与本地模型玩家参考。

KittenTTS 是最近非常有趣的英文TTS模型,体积小、运行快、无需GPU,支持多种语音风格,可应用于播客配音、教育辅助、AI助手和网页应用。

ListenHub 是一款高拟人度 AI 声音生成工具,支持文字转语音、音色克隆、AI 播客、解说视频和 PPT 语音讲解。其 FlowSpeech 技术让语音更自然真实,几乎无法分辨是否为 AI,非常适合自媒体创作者、教育内容生产者和多语言内容需求用户。