免费AI“神器”第十三弹：会20种语言的数字人爆火；机器人能提前08秒预测人类表情

新闻资讯

分类

新闻资讯

NEWS MESSAGE

免费AI“神器”第十三弹：会20种语言的数字人爆火；机器人能提前08秒预测人类表情

发布日期：2024-04-14 14:39:03

　　Ideogram 是一款超强文字生成图像工具，旨在生成包含可以清晰阅读文本的图像。该模型由谷歌前员工组成的创业团队打造，团队成员曾参与开发谷歌的 Imagen 图像生成软件和视频生成模型。

　　产品功能：Ideogram 的主要功能为文生图功能，但与其他图像生成模型不同的是，Ideogram 擅长生成包含文本的图片，用户只需输入提示词，Ideogram 就可以按照要求将文字融入生成的图片中，实现平面、悬浮甚至立体文字效果。比如生成电影、产品海报、T 恤印花等图像，解决了生图 AI 在图像文字生成上的痛点。

　　近期上线的 Ideogram 1.0 版本在正确显示文本方面有了显著提升，生成的图像也更加逼真，可以对复杂提示词进行精确响应。Ideogram 表示，参与测试的评估者对于 Ideogram 1.0 在提示对齐、图像连贯性、整体偏好和文本渲染质量方面的偏好超越了 DALL · E 3 和 Midjourney V6。

　　同时 Ideogram 1.0 还引入了一个名为魔法提示的新功能，该功能可以根据用户的原始描述，编写更详细的提示词，进而创造出更美观且具创意的图像。

　　此外，Ideogram 1.0 版本还能理解冗长、复杂的提示词，生成清晰、逼真的图像，包括动物、奇怪组合的呈现，以及照片级逼真的人物表情和手部动作。

　　付费方面，用户每天能免费使用 25 个提示词，生成 100 张图。8 美元月付费用户每天可以生成 100 个提示词，400 张图。20 美元月付费用户可以无限使用。

　　产品信息：LaVi-Bridge 是一个无需训练将不同的语言模型和生成视觉模型结合起来，以实现文本到图像的生成的技术框架，该框架CQ9电子 CQ9电子游戏由香港大学、香港中文大学和香港科技大学的研究团队共同开发。

　　产品功能：通过使用 LoRA（Low-rank Adaptation）和适配器，LaVi-Bridge 提供了一种灵活且即插即用的方法，无需修改原始模型的权重。这个框架兼容多种语言模型和生成视觉模型，能够适应不同的结构。

　　在这一框架内，团队证明了通过整合更高级的模块（如更先进的语言模型或生成视觉模型）可以明显提高文本对齐或图像质量等能力，经过大量评估验证了 LaVi-Bridge 模型的有效性。CQ9传奇电子 CQ9电子

CQ9电子·(中国)官方网站