当前位置: 初中语文 /
  • 1. (2024·百色模拟) 现代文阅读I

    【材料一】

    Sora,美国人工智能研究公司Open AI发布的人工智能文生视频大模型(但Open AI并未单纯将其视为视频模型,而是作为“世界模拟器”),于北京时间2024年2月15日正式对外发布。

    Sora可以根据用户的文本提示创建最长60秒的逼真视频。该模型了解物体在物理世界中的存在方式,可以深度模拟真实物理世界,能生成具有多个角色、包含特定运动的复杂场景。它继承了DALL-E3(Open AI于2013年9月推出的人工智能图像生成器)的画质和遵循指令能力,能理解用户在提示中提出的要求。

    (摘编自网络)

    【材料二】

    Sora模型的特点可以总结为“真、灵、动”。所谓“真”,是指Sora生成的视频真实感强,能够很好地表现提示词的内容语义,视频细节呈现恰到好处。“灵”是指生成的视频有一定的灵性和艺术性,Sora生成的短视频无论质量还是艺术性,都有一定的保证。“动”就是视频中运动的场景与物体的结构性和时空关联性很好。

    那么,从技术角度说,Sora是如何实现上述特点的呢?

    Sora通过扩散模型(Diffusion Model)来实现“真”和“灵”。扩散模型是一种借鉴物理热力学中扩散原理的生成模型,通过加噪、去噪,实现由文本驱动图像生成。当然,大数据对扩散模型的训练也非常重要,Sora“看”过大量高质量的图像,“阅图无数”让扩散模型能够掌握很精细的特征,从而根据提示词生成细节精细的图像。

    Sora的“动”有赖于Transformer(中文通常翻译为“变形金刚”或“变压器”)。Transformer就是GPT里面的T,它本质上是具备“自注意”和“自监督”学习能力的新型神经网络。首先是“自注意”。比如输入“东方明珠是上海的标志性建筑之一”这么一句话,Transformer通过“自注意”机制能够自动学习到“东方明珠”和“上海”的关系,不仅能够注意到“东方明珠”是一个特定的名词,而且还能注意到它与“上海”及其“著名地标”的关联性。“自监督”指的是,在一篇文章中随机遮掉一定比例的单词或者句子,让Transformer自己监督自己,学会做完形填空(填上“东方明珠”这个名字)、句子接龙(接上“东方明珠是上海的标志性建筑之一”这个句子),甚至更复杂的任务。之前的机器学习的主要瓶颈就是学习数据不够,具备了“自监督”学习能力之后,人类所有的语言数据都可以用于训练人工智能模型。GPT、BERT等大语言模型都基于Transformer。在GPT等大语言模型基础上,Sora先将视频表示为图像块(Patch),再用图像块来代替文字输入Transformer,就能够学到物体跟物体、人跟物体、人跟人、光跟影等之间的关系。

    (节选自2024年3月10日“上观新闻”报道)

    【材料三】

    随着深度学习算法日趋成熟以及数据资源的加速增长,人工智能技术有望不断提升,机器视觉和自然语音处理等人工智能技术将迎来发展新机遇。预计2024年,我国人工智能产业规模将达到335.6亿元。

    1. (1) 下列说法中,与材料一、材料二意思不相符的一项是( )
      A . Sora是美国公司发布的人工智能文字视频大模型,可以深度模拟现实世界。 B . Sora能生成包含特定运动的复杂场景,能够理解用户在提示中提出的要求。 C . Sora生成的视频真实感强,有一定的灵性和艺术性,质量上也有一定的保证。 D . Transformer本质上是具备“自注意”和“自监督”学习能力的新型神经网络。
    2. (2) 下列对材料三的分析,有误的一项是( )
      A . 我国人工智能产业自2016年以来规模越来越大。 B . 从2016年到2024年,我国人工智能产业增速呈现曲线形式,其中2016年增速最大。 C . 我国人工智能产业增速有起有伏,自2021年以来增速稳定在10%左右。 D . 我国人工智能产业增速在2020年又形成一个小高峰,之后一直下降。
    3. (3) Sora强大的创作能力将会在哪些领域得到应用?对Sora可能产生的颠覆性影响,我们中学生应如何应对? 

微信扫码预览、分享更方便