文档内容
读懂“文生视频”背后的机遇与挑战
人人都能当导演的时代,或许离我们不再遥远。近日,人工智能
研究公司 OpenAI 发布了旗下首个文生视频大模型 Sora,引发广泛热
议。
“比想象中来得更快”,这是业内人士对横空出世的 Sora 模型
的评价。从聊天程序 ChatGPT 到绘图工具“Midjourney”,再到更懂
中国文化的“文心一言”,AI 大模型更新换代的间隔越来越短,应
用场景却愈发丰富。技术变革的机遇似乎就在我们眼前,没有谁愿意
错过下一个科技进步的“奇点”。
仔细揣摩这段十几分钟的演示视频,不难揪出其中的“穿帮”镜
头。时尚女郎的左手畸形,双脚不时错位;跟拍视角转动了 180 度,
猫咪却仍正对画面;前进的队伍高举木棍“隔空舞龙”,配上复杂难
辨的汉字……但从整体上看,AI 生成的视频仍有着广阔的应用前景
——夜幕将至,圣托里尼的鸟瞰图宛若实景;模糊抽帧,仿佛置身淘
金热时期的加利福尼亚。人眼特写中跃动的风景,地铁车窗上倒映出
的人影,黑白荧幕里不断闪回的经典镜头,雪地打滚的动物与飞扬的
毛发……这些技术合成的画面每每以假乱真,令人震撼。
借助大量的数据训练,AI 对语言描述的理解愈发准确,它对于
现实世界的还原也不再局限于帧与帧之间粗浅的拼接,而是变得更加
生动逼真。有人畅想,技术能否让人“以梦为笔”,自由描绘心中的
1盛景;有人期待,AI 能否降低部分影视镜头的拍摄成本,或是助力
未来产业发展;也有人担忧,无节制的生成是否会令创意“遭重”,
饭碗不保。这需要我们在发展中寻找答案,在直面问题中解决问题。
“这两天 Sora 的诞生,让大家切实感受到数据智能变革的来临。
每一天,从生活到产业领域,都可能面临变革。”日前召开的广东省
高质量发展大会上,郑海荣院士的发言发人深省。生成式人工智能作
为一项前沿技术,既活跃在科学家脑中、实验室、机房里;也能变为
一串串代码、一个个答案、一段段视频,为我们的生活带来巨变;更
影响着生产方式的变革和产业深度转型升级,关乎科技自立自强。目
前,Sora 提供的文生视频功能仅向专业人士开放,也有许多人看到
了其中蕴含的无限机遇。机会只会留给有准备的人,紧盯颠覆性、前
沿性技术,抓牢战略性、先导性产业,才能赢得战略必争领域的胜利,
立于科技浪潮的潮头。
“抓住了机遇,我们就能实现换道超车、后发崛起;错失了机遇,
我们的差距可能被进一步拉大,又将在不利的位势徘徊。”实现产业
科技互促双强前景无限,发展新质生产力势头良好。近年来,一批批
本土创新企业聚焦相关领域探索应用,取得了一系列成果,也积累了
创新的要素和经验,实现了经济效益和市场竞争力的双丰收。下一步
更要争做创新的主角,积极参与构建“基础研究+技术攻关+成果转化
+科技金融+人才支撑”全过程创新链,吸引聚集精英人才、构建创新
平台、改善转化方式,助推创新要素高效转变成新质生产力。
2广东人工智能产业基础扎实,竞争力强,相关企业数量排在全国
第一;起步早,后劲足,全国每 5 家“AI 独角兽”就有一家在广东;
投融资持续活跃,市场潜力巨大,研发创新实力牢牢占据国内头
名……更强的实力也意味着更高的期待和沉甸甸的责任,期待广东抢
抓人工智能发展机遇,勇做创新驱动的排头兵。(via 南方日报)
3文生视频亮相,给教育敲响了警钟
开发出热门聊天机器人 ChatGPT 后,OpenAI 继续在生成式人工
智能上玩出新花样。
2 月 16 日凌晨,OpenAI 再次扔出一枚深水炸弹,发布了首个文
生视频模型 Sora。据介绍,Sora 可以直接输出长达 60 秒的视频,并
且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角
色。目前官网上已经更新了 48 个视频 demo,在这些 demo 中,Sora
不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具
有丰富情感的角色。该模型甚至还可以根据提示、静止图像填补现有
视频中的缺失帧来生成视频。
“天哪,现在起我们要弄清什么是真的,什么是假的”“我的工
作没了”“整个影像素材行业被血洗,安息吧”……ChatGPT 所带来
的震撼似乎还在眼前,Sora 再度刷新了公众的认知。尽管 Sora 目前
仍有很大缺陷,AI 在理解现实世界的能力依然基于大量的训练,而
不是 AI 本身对世界的理解,其对视频的处理依旧是有很多局限性,
甚至包括很基本的事实错误,但足以“以假乱真”的视频效果,还是
令人惊艳不已。不乏有人惊呼,人类再一次站到了科技颠覆社会生活
方式的新奇点位置。面对不断迭代升级的 AI,很多人都担忧自己会
不会被“替代”,而人工智能时代教育何去何从,同样值得引发教育
工作者们深思。
4AI对于我们来说并不陌生,早在1997年IBM超级计算机“深蓝”
便打败了国际象棋大师加里卡斯帕罗夫。2016 年 AlphaGo(阿尔法围
棋)与李世石之间震撼世界的“人机大战”之后,公众对人工智能更
是刮目相看。ChatGPT 的能力则“更上一层楼”:它基于大量数据训
练可以学习和理解人类的语言并进行交流对话……毫不夸张地说,技
术正在迅速地改变着这个时代,教育也必须与时俱进地变革,才能培
养出未来需要的人才。
毋庸讳言,人工智能时代,很多工作都会被取代,甚至包括一些
专业性较强的会计、医生等工作。因此,教育应该关注的是那些不能
被人工智能取代的能力,如感知能力、创造力和洞察力,以及与人合
作的能力等。与之相应,学习的主要目的就是培养分析思辨能力、实
践能力、合作交流能力等一系列机器无法具备的核心素养和能力,帮
助学生树立终身学习的意识,而不是获取简单的记忆类知识,要让学
生从死记硬背的灌输式教育中解放出来。一言以蔽之,更重要的教育
应当在书本之外。
英国惠灵顿公学的校长托马斯曾坦言:目前的教育和考试系统都
是源自于过去的时代,这种强调记忆力的教育仅适合过去的时代。他
认为,教育的本质在于释放孩子各方面的天性。在中学阶段,应该给
孩子们留下更多可以伴随一生的良好品格,即积极、慎思、独立、个
性和包容这五大特质。
5令人遗憾的是,信息时代的教育,不少地方却依然停滞在工业文
明时期。学生就像工厂流水线上的产品,统一步调和型号,简直成了
生产出来的机器。当机器成了“人”,而人却成了“机器”,这究竟
是一种怎样的悲哀啊!毫不夸张地说,人工智能已经敲响了应试教育
的丧钟,只会低头看分数的教育,必然没有明天。
换言之,面对人工智能时代,学校教育迫切需要更新教育教学观
念。人工智能或将颠覆我们既有的教育认知,不是狼来了而是全新的
知识储备革命,不是既有的几何级变革而是断代式跨越,人类可能就
此腾空而不是迈进。就此而言,ChatGPT 和 Sora 等的出现,与其说
是教育遭遇空前危机,不如说是带来了变革的莫大契机。(via 东方
网)
粉笔说:
6近日,“文生视频”模型 Sora 的发布,引发了广泛热议。在输
出的视频中,有高度细致的背景、复杂的多角度镜头,虽然 Sora 生
成的视频还有很多显而易见的缺陷,但不可否认它的出现意味着人工
智能技术已经发展到一个新的高度。我们可以看到,人工智能技术带
来了生产方式的变革和产业结构的升级,但人工智能技术也会带来巨
大的挑战。因此,我们要把握机遇、迎接挑战,一方面,要在相对不
利的环境中谋求新的发展,紧盯颠覆性、前沿性技术,抓牢战略性、
先导性产业,并在人工智能的一些局部领域集中发力。另一方面,要
加强人工智能领域人才培养力度,打造多层次人才培养平台,为科技
和产业发展夯实人才支撑。此外,还要不断进行配套政策的优化完善,
加速人工智能技术的落地应用。
7免责声明
本资料仅供内部交流使用,非商业用途。在未取得粉笔许可前,任何人士或
机构均不得以任何方法或形式复制、出版、发放及抄袭本资料内容作商业或非法
之用途,违者必究。
遇见不一样的自己
come to meet a different you