CQ9电子Meta去年推出了Segment Anything,这是一个机器学习模型,可以快速可靠识别和勾勒出图像中的任何东西。Meta首席执行官马克·扎克伯格周一在SIGGRAPH大会上首次亮相了该模型的续集,将该模型带入了视频领域,彰显了该领域的发展速度之快。
分割是一个技术术语,指的是视觉模型在查看图片时,会挑选出各个部分:“这是一只狗,这是狗身后的一棵树”,但愿如此,而不是“这是从狗身上长出来的一棵树”。这种现象已经存在了几十年,但最近图像识别机制变得更好、更快,其中“分割一切”是向前迈出的重要一步。
Segment Anything 2(SA2)是一个自然的后续产品,因为其本身适用于视频而不仅仅是静止图像;当然,你可以对视频的每一帧单独运行第一个模型,但这并不是最有效的工作流程。
“科学家可基于SA2来研究珊瑚礁和自然栖息地等,且无需拍摄任何镜头,这非常酷。”扎克伯格在与英伟达首席执行官黄仁勋的对话中表示。
当然,处理视频对计算的要求要高得多,SA2可以在不消耗数据中心的情况下运行,这证明了整个行业在效率方面的进步。当然,它仍然是一个庞大的模型,需要强大的硬件才能运行,但即使在一年前,快速、灵活的分割也几乎是不可能的。
与第一个模型一样,SA2也将向用户免费开放,目前还没有关于托管版本的消息,当然,这样的模型需要大量的数据来训练,而Meta还发布了一个包含50000个视频的大型带注释数据库。在描述SA2的论文中,另一个包含超过100000个“内部可用”视频的数据库也用于训练。
Meta几年来一直是“开放”AI领域的领导者,但最近,LLaMa、Segment Anything和免费推出的其他一些模型已成为这些领域AI性能相对可及的标准,尽管这些模型的“开放性”仍存在争议。
而对于开源,扎克伯格表示:“SA2不仅仅是一个你可以构建的软件——你需要一个围绕它的生态系统。如果我们不开源它,它几乎就不会那么好用,对吧?我们这样做不是因为我们是利他主义者,尽管我认为这会对生态系统有所帮助——我们这样做的目的是因为认为这将使我们正在构建的东西成为最好的。”
最近招聘信息表明,Meta Codec Avatars虚拟化身即将走出实验室,进入产品阶段。
Meta目前有多个与Codec Avatars相关的空缺职位,该公司正在招聘一名设计原型师和一名 iOS开发工程师等。
“在我们的团队中,你将探索、设计原型并构建体验,定义人们如何通过Codec Avatars沉浸式远程呈现进行交互的未来;你将与工程师、科学家和研究产品经理密切合作,构建和扩展内部XR呼叫服务,并解决独特、复杂且微妙的用户和研究人员挑战。”
对于iOS开发人员来说,Meta正在招聘“具有用户界面、基础设施和/或使用iOS SDK开发 iPhone或iPad应用工具”的工程师。
Meta多年来一直在研究Codec Avatars;该研究于2019年首次向公众展示。
Meta没有透露的是,Codec Avatars使用配备4块GeForce RTX 4090显卡的工作站来实时渲染虚拟化身。而这并不是该技术商业化的唯一障碍:人们必须在专门的工作室中进行细致的扫描。
不过,2024年3月,Meta研究主管Yaser Sheikh在一次演讲中表示,Codec Avatars旧版、不太逼真的版本已经可在VR一体机上运行,用户只需用智能手机扫描一分钟的脸部即可创建化身,Meta将这称为即时Codec Avatars。
iOS开发工程师的职责可能是创建一个App,以指导用户完成扫描过程并使用未来的Quest 头显实现XR通话。
最近也有迹象表明Codec Avatars即将推出,因为表明其已实现的代码字符串在Quest固件中被发现;尚不清楚Codec Avatars可能会应用于哪些头显。目前,只有Meta Quest Pro支持面部和眼部追踪;像Quest 3必须根据语音等其他因素来猜测面部表情。
由于苹果凭借Spatial Personas功能抢先一步,Meta也渴望最终将这项技术商业化,并希望在2024年Meta Connect上能推出这项技术。
法国奢侈时装品牌巴黎世家和德国高端行李箱品牌Rimowa推出了适用于Apple Vision Pro的应用,扩展了该头显的沉浸式时尚体验。
巴黎世家Vision Pro应用旨在为用户提供时装秀和系列沉浸式视图。该应用提供了巴黎世家2025年春夏时装秀独家无人机视图和立体镜头,用户还可以访问交互式产品手册和过往系列内容,从而能在虚拟环境中探索巴黎世家时尚内容。
另一方面,「Rimowa」Vision Pro应用也支持沉浸式互动体验,使用户能详细了解该品牌的标志性行李箱。该应用具有Rimowa产品的高分辨率3D模型,让用户可以从各个角度检查工艺和设计;其还包括虚拟试穿等功能,用户可以在虚拟空间中看到不同行李箱模型的外观和功能。此外,「Rimowa」Vision Pro应用还提供了虚拟展厅体验,用户可用不同的颜色和配件定制行李箱,并实时查看变化。
巴黎世家和「Rimowa」Vision Pro应用是奢侈品牌探索Vision Pro潜力的更广泛趋势的一部分。古驰和巴黎世家一样,也是Kering旗下的品牌,该公司于4月发布了Vision Pro应用,让用户可以观看一部关于创意总监Sabato De Sarno和Gucci 2024年春夏系列创作的沉浸式迷你纪录片。其他零售商,包括Mytheresa、J.Crew和Elf Cosmetics,也开发了Vision Pro应用,更注重购物而不是品牌故事宣传。
人工智能(AI)平台软件市场在2023年快速增长,预计将保持其惊人的势头,这得益于许多行业越来越多采用人工智能。IDC最新预测显示,人工智能平台软件的全球收入将在2028年增长至1530亿美元,2023-2028年预测期内的复合年增长率(CAGR)为40.6%。
IDC集团副总裁兼人工智能、自动化、数据和分析研究总经理Ritu Jyoti表示:“AI平台市场没有显示出任何放缓的迹象。生成式AI的快速创新正在改变企业对产品的看法、开发和部署AI应用程序的方式,以及如何利用技术重塑业务模式和竞争定位。IDC预计,随着支持互操作API、生态系统可扩展性和大规模AI采用的预测和生成式AI统一平台的出现,这种上升趋势将继续加速。”
根据IDC《2023年全球人工智能平台软件市场份额》,2023年人工智能的采用率飙升至新高,全球人工智能平台软件收入同比增长44.4%,达到279亿美元。微软在人工智能平台软件市场的领导地位可以归因于其强大而全面的产品及其庞大的产品和服务生态系统。微软人工智能解决方案与其流行的软件和云服务深度集成,为企业和开发人员提供无缝体验。另外,Palantir、OpenAI、谷歌和亚马逊网络服务位列2023年人工智能平台软件供应商前五名。
根据IDC未来企业弹性和支出调查,目前在生产中部署GenAI的组织中有一半已经选择了AI 平台,而大多数已启动大量投资的组织将在未来六个月内这样做。
IDC人工智能和自动化研究经理Raghunandan Kuppuswamy表示:“人工智能有潜力提升用户体验、优化广告、个性化内容和改进数据分析。这些进步可以推动在线活动和商业的增长,从而产生积极的经济影响。然而,人工智能也带来了巨大的风险,组织需要识别模式和异常,识别潜在风险,并在问题蔓延之前进行补救。虽然并非所有风险都可以消除,但可以使用人工智能本身来加速风险缓解,为客户提供更好的安全性和弹性。”
人工智能平台促进人工智能模型和应用的开发和部署,包括可模仿人类认知能力的智能助手。人工智能平台的技术组件包括机器学习(ML)、深度学习、生成式人工智能(GenAI)、自然语言处理(NLP)、文本分析、富媒体分析、标记、搜索、分类、聚类、假设生成、问答、可视化、过滤、警报和导航。人工智能平台市场由三个功能市场组成:人工智能生命周期软件、人工智能软件服务以及搜索和知识发现软件。
IDC预计,基于云的AI平台软件部署将以比本地部署更快的速度增长,预计公有云AI平台收入的五年复合年增长率将达到50.9%。这一趋势归因于云供应商提供的先进安全措施、数据和法规遵从性以及可扩展性功能。随着技术的快速进步和各行各业企业对AI解决方案的需求不断增长,基于云的AI平台软件部署预计将继续快速扩张。
投资者关系关于同花顺软件法律声明运营许可联系我们友情链接招聘英才用户体验计划
不良信息举报电话举报邮箱:增值电信业务经营许可证:B2-20090237