资讯 人工智能
此为临时链接,仅用于文章预览,将在时失效

独家 | 香港大学徐东教授新成立文生视频大模型公司「徐图智能」 | 雷峰网-米乐m6平台

2023/12/07 14:55


独家 | 香港大学徐东教授新成立文生视频大模型公司「徐图智能」


作者丨郭思

编辑丨陈彩娴

大模型的创业进入2.0阶段,除了此前如雨后春笋出现的自然语言公司之外,瞄准视觉大模型应用的创业公司也陆续成立。

近日,ai 科技评论独家获悉:ieee fellow、香港大学教授徐东成立了一家 ai 公司——徐图智能,定位是基于视觉大模型技术,提供文生视频等服务。

企查查信息显示,该公司于今年6月成立,仍处于注册状态。

独家 | 香港大学徐东教授新成立文生视频大模型公司「徐图智能」

团队成员方面,徐东担任徐图智能 ceo,他于2001年和2005年在中国科学技术大学取得学士和博士学位,目前担任香港大学计算机系教授。

他曾在微软亚洲研究院、香港中文大学和哥伦比亚大学从事研究工作,并在南洋理工大学和悉尼大学任教。徐东教授在计算机视觉、多媒体信号处理以及机器学习等领域做出了重要贡献,在ieee transactions和国际顶级会议上发表了150余篇论文,其中两篇论文分别获得t-mm 2014最佳论文奖和cvpr 2010最佳学生论文奖。徐东教授是ieee和iapr fellow,于2018和2021年两次入选科睿唯安 (clarivate analytics)高被引学者,同时也担任acm computing surveys (csur)资深副主编。

在徐东加码之下,徐图智能在文生视频领域有强大的技术基础,其团队或也绝大多数来自香港大学、商汤等名校或名企。

长久以来,相对于文本、代码和图片生成,视频生成(text-to-video)也一直被认为是 aigc 的“高地”,面临庞大的计算需求、高质量数据集短缺、可控性等挑战。所以对于视频的gpt时代,人们一直抱有期待但迟迟没见其到来的迹象。

但近期,视频领域似乎迎来了新的春风。runway 先后发布了 gen1、gen2, motion brush 则近期朝视频可靠性向前了一步,stability ai 也发布了自己的首个 text-to-video 模型 stable video diffusion。今年 7 月,pika labs 在 discord 推出服务器,并在几个月时间内收获了 50 万用户。

不过相比起文本和图像领域,视频创业要想取得突破一段还有漫长的路程。行业一致认为,视频生成的主要难题在于时长,跟时长相关的是动作的意义,不仅要延长视频制作的时长,还要关注动作的意义,看它到底能做多复杂的动作。

其次,视频的清晰度也需要进一步提高。尽管清晰度方面已经有突破,但还没有提高到电影级的水平,现在生成的视频一般是720p分辨率,视频的流畅性也不够理想,特别是一些细节的texture。

而对于pika labs创始人提出的视频生成处于类似gpt-2的时期,徐东则在2023年新一代人工智能创业大赛的主题演讲中提出,视频生成暂时还无法直接定义为来到了gpt时代,但可以肯定的是已经初现曙光,这或许也和徐东此次创立文生视频创业公司息息相关。

大模型创业公司的机会在哪里?文生视频领域能否迎来gpt时刻的?欢迎添加作者微信(lionceau2046)交流,互通有无。

雷峰网 雷峰网 雷峰网

雷峰网 雷峰网(公众号:雷峰网) 雷峰网


长按图片保存图片,分享给好友或朋友圈

独家 | 香港大学徐东教授新成立文生视频大模型公司「徐图智能」

扫码查看文章
米乐m6平台

正在生成分享图...

取消
相关文章
网站地图