短短几个月的时间,AI-Generated Content (AIGC),也就是人工智能生产的内容,迅速席卷全球,犹如魔法一般的力量。据OpenAI的研究论文指出,超过80%的美国人在工作中受到ChatGPT等AI工具的影响。令人惊讶的是,在约19%的岗位中,近一半的工作任务已经被AI自动化代替,这引发了人们对未来的思考和担忧。
AI技术正在渗透和改变现有的每一个行业,这无疑是AIGC和AI工具的黄金时代。在这个数字化和智能化的时代,人们发现AI不仅仅是一种技术,它是一种催生创新、提升效率和改变工作方式的力量。随着越来越多的企业和组织开始应用AI,我们将迎来更多与AI相关或由AI创造的杀手级应用和现象级产品。
然而,面对这样的变革,我们必须更深入地了解AI,才能够驾驭它,与它和谐共处。首先,我们需要对AI的工作原理和局限性有清晰的认识,以避免过度依赖和不合理的期望。AI虽然强大,但它仍然是工具,需要人类智慧和决策来引导它的应用。
其次,我们应该鼓励并投资于AI的研究和发展,推动AI技术在更广泛的领域得到应用,以便实现更多的创新和社会进步。同时,我们也需要重视AI对劳动力市场的影响,积极为工人提供转型和培训机会,以适应未来工作的需求。
最重要的是,我们必须确保AI的发展是符合伦理和法律标准的。在AI应用的过程中,必须考虑隐私、安全和公平性等重要问题,以确保AI技术的合理和负责任的使用。
在这个AI改变世界的时代,我们需要拥抱科技进步,同时也要明智地运用AI,让它为我们创造更美好的未来。只有通过持续学习和积极应对,我们才能更好地适应这个不断演变的数字时代,与AI共同谱写更加璀璨的未来。
一、AI的两种类型
AI可以分为两种类型:决策式/分析式AI(Discriminant/Analytic AI)和生成式AI(Generative AI)。
- 决策式/分析式AI
决策式/分析式AI主要侧重于对已有数据进行分析、判断和预测。它能够利用现有数据来做出决策,并辅助推荐系统和安全系统等进行决策过程。这类AI主要关注对现实事物的理解和分析,其运行依赖于对历史数据的学习和归纳。
- 生成式AI
生成式AI则通过机器学习分析和归纳已有数据,并根据历史信息进行模仿和拼合式的创作,从而生成全新的内容。与决策式AI不同,生成式AI不仅仅是对现有数据的复制,它具备较强的随机性,能够创造出独特的内容。生成式AI背后的核心是三类基础大模型:
-
视觉大模型:提高AI的理解能力,使其能够对不同场景、环境和条件下的图像进行准确辨别和理解。
-
语言大模型:增强AI的表达能力,让它能够将文字进行拼接和整合,形成人类可理解的语法和内容。
-
多模态大模型:提升AI的内容制作能力,将声音、影像、文字等不同模态的原始数据映射到统一或相似的语义空间中,实现不同模态数据的相互融合和内容生成。
这些生成式AI大模型的引入使得AI具备了更强的创造性和想象力,为未来的艺术、娱乐、文学等领域带来了巨大的发展潜力。然而,同时也需要注意潜在的伦理和道德问题,并确保AI技术的发展是符合社会价值观和法律规范的。
二、 AIGC的九大应用场景
Category | Platforms/Tools | Applications |
文本生成 (Text Generation) | ChatGPT, CopyAI, Writesonic | – 报告资料 (Report Writing)
– 新闻/故事稿件 (News/Story Writing) – 营销文案 (Marketing Copywriting) |
图像生成 (Image Generation) | Midjourney, Stable Diffusion | – 插画设计 (Illustration Design)
– 交互设计 (Interactive Design) – 绘本设计 (Picture Book Design) |
音频生成 (Audio Generation) | WaveNet, DeepMusic | – 书籍朗读 (Audiobook Narration)
– 地图导航 (Map Navigation) – 乐曲合成 (Music Composition) |
视频生成 (Video Generation) | Runway, Deepfake | – 视频剪辑 (Video Editing)
– 影像合成 (Visual Effects) – 电影后期 (Film Post-production) |
3D生成 (3D Generation) | Magic3D, DreamFusion | – 意向图生成 (Concept Art Generation)
– 模型渲染建造 (Model Rendering and Visualization) – 智能制造 (Smart Manufacturing) |
游戏生成 (Game Generation) | 腾讯AI Lab, Roblox Studio | – 元素生成 (Element Generation)
– 场景绘制 (Scene Design) – 规则策略 (Rule-based Strategy) |
数字人生成 (Digital Human Generation) | 腾讯, 阿里云, 科大讯飞 | – 人物形象 (Character Creation)
– 视频合成 (Video Composition) – 实时交互 (Real-time Interaction) |
代码生成 (Code Generation) | Codex, Tabnine, CodeT5 | – 代码补全 (Code Autocompletion)
– 代码编写 (Code Writing) – 自动注释 (Auto Commenting) |
跨模态生成 (Cross-modal Generation) | ChatGPT4, 百度文心 | – 文本生成图像、视频等多种模态数据之间的相互转换 (Conversion between Text, Image, Video, and other modalities) |
三、AIGC对工作流程的影响
AIGC对工作流程的影响是逐渐改变人类创作者与工具之间的协作关系,形成全新的分工方式。叠加了AI技术的工具变得更易用,能力和生产内容更加贴合人类需求,也拥有更多话语权。
- 阶段一:较早之前,人类是主要且相对独立的内容创作者。创作过程完全由人类完成。
- 阶段二:人类开始将机器作为效率工具,以大幅提升生产力。尽管效率工具的应用带来了提效效果,但人与工具之间仍然存在学习和沟通成本,工作流程仍然相对传统。
- 阶段三:人类与机器实现更深度的协作。AI自然语言处理能力的增强,使得人与工具之间的沟通更加无缝衔接,降低了沟通的阻力和成本。AI模型成为了一个重要的组成部分,与效率工具和人类创作者一同协同工作,共同完成内容的创作和生产。
这种新型的协作模式,使得人类创作者能够更好地发挥自己的创造力和想象力,而AI模型则提供了更高效的工具和内容生成能力。AI的介入不再是简单的效率工具,而是成为了一个有机的协作者,为工作流程带来了革命性的改变。
随着AIGC技术的不断发展,这种协作模式将进一步深化,AI将在越来越多的领域发挥更重要的作用,与人类创作者共同推动着各行各业的发展。然而,我们也需要关注伦理和道德层面的问题,确保AI技术的应用是符合社会价值观和法律规范的,让AIGC成为推动社会进步和发展的积极力量。
四、AIGC的驾驭方法
当前的AIGC通过Prompts Engineering(提示词工程)来实现创作输出。不同平台的Prompt(提示词)写法各不相同,例如ChatGPT选择了人类日常说话的方式,而Stable Diffusion则使用多关键词来描述内容。
由于AIGC具有较强的不确定性,为了确保每次生成的内容更具一致性,模型会在生成内容的同时产生一个Seed编码。Seed(种子)就像一个锚点,能够将生成的结果锚定在一个特定的范围内,从而在一定程度上控制随机性。
结合Seed、Prompts以及一致的参数设置,AIGC能够生成一组相似的图像。这种方法可以被看作是一种新型的压缩包或Design Token,任何人都可以使用它来生成特定的内容。
举个例子,用户使用Midjourney生成连环画时,通过Seed+Prompts的组合,可以保证男女主人公的外貌特征和画面风格的一致性。这种技术让创作者能够更好地控制AIGC的输出,确保生成的内容符合其预期,并提供了更多的创作灵感和可能性。
这种Seed+Prompts的方法不仅在图像生成中有应用,还可以推广到其他领域,为不同类型的内容创作提供更稳定、一致的输出结果,进一步拓展了AIGC的应用范围和潜力。
五、AIGC对交互设计的影响
- AI的替代与效率提升
AI正在或将会取代大量基础设计师的工作岗位,尤其是那些以执行为主、只需要少量思考和决策的工作。这样的变革将导致创作和实现的过程分离,从而大幅节省方案实现的时间和成本,提高产出的效率和质量。
- 交互方式与体验的创新
未来,大部分工具都会融合AI这一功能属性。目前我们通过输入Prompt来操作AI,而这种输入方式将逐渐演变成一种指令操作的交互界面,成为设备上的通用能力,贯穿各种产品之间。用户将能够随时通过自然语言来操控产品,满足自己的需求。产品和设备的交互形态和体验将发生巨大变化,交互体验设计也将拥有更多的创新可能性。
- 职能内容与方向的扩展
AI时代带来了生产力的巨大变革,导致工作岗位和职能被重新优化和调整,现有工种之间可能会相互融合,同时也会催生出全新的工种。在这个时代,设计师需要更加关注如何在团队中扮演不可替代的角色。他们应该不断学习和适应新技术,深化对AI的理解和应用,以便更好地与AI合作,发挥自身的优势,并在创作过程中体现独特的价值。
AI的发展将引发基础工作的替代和效率提升,同时创新交互方式和体验将成为未来的趋势。在这个时代,设计师需要拥抱变革,积极适应新技术,以便在职能内容和方向的扩展中发挥更大的潜力,保持在设计领域的领先地位。只有这样,设计师才能不断创新,满足用户需求,并在激烈的市场竞争中取得成功。
六、AIGC产品的三大运转方式
在AIGC市场中,头部产品的运营方式存在较大的差异,通常可以分为三类:中心化、去中心化和社区化。
- 中心化(如OpenAI):
中心化的方式更注重对AI的管理和控制。公司如OpenAI会对模型的训练数据进行封闭,并不公开分享。这种方式有利于管理AI的伦理道德、版权归属等安全性问题。中心化的产品通常受到严格的监管,以确保AI技术的合理和负责任的应用。
- 去中心化(如Stable Diffusion):
去中心化采用完全开源的方式,即任何人都可以在源代码上进行修改,开发自己的版本。模型训练的数据也完全公开。这种方式更加开放和自由,容易产生优质内容。它让每个民族、团体、社区等都能够拥有自己风格的AI模型,让开发者拥有更多发挥空间。
- 社区化(如MidJourney):
社区化的产品中,所有参与的成员都可以即时看到刚被生成的图像,并通过优化提示词来制作变体,快速迭代图像的质量。整个社区中的成员与模型本身,都会受益于每一次的图像生成。这种方式鼓励用户之间的互动和分享,形成了一个相互支持和合作的社区生态。
不同运营方式的AIGC产品各有优势和适用场景。中心化方式注重安全和监管,有助于保障AI技术的可持续发展;去中心化方式更加开放和创新,有助于促进优质内容的产生;而社区化方式则强调用户的参与和反馈,形成一个共享成果的生态系统。
随着AIGC技术的不断发展,各种运营方式的产品将共同推动着AI领域的进步。在未来,可能会看到更多不同类型的产品出现,从而满足不同用户和需求的多样化。无论是中心化、去中心化还是社区化,都将在AIGC市场中发挥着重要的作用,推动人工智能技术的广泛应用与发展。
七、AIGC的未来发展历程
红杉资本在2022年9月对AIGC的发展做出如下预判:
- 文字类AI生成将在2023年进入黄金时期;
- 图片类AI生成将在2025年左右进入黄金时期;
- 视频/3D类AI生成将在2030年左右进入黄金时期。
八、 AIGC的三层产业链结构
AIGC产业链结构可分为三层:基础层、中间层和应用层。
九、AIGC的五种营收模式
在AIGC赛道上,实现商业模式并产生实际营收,根据《中国AIGC产业全景报告2023》,有以下五种营收模式:
- 模型即服务(MaaS)
这种模式适用于基础层和中间层的变现,根据对大型模型的数据请求量和实际计算量收费。预计到2027年,MaaS模式将占据市场营收规模的比例从5%增长至47%。
- 按内容产出量收费
此模式适用于应用层变现,如按照图片张数、请求计算量、模型训练次数等收取费用。在这种营收模式下,关键在于如何吸引用户进行尝试,并确保产品具有较高的复购率。但同时,也受到多个因素的制约,例如版权授予、是否支持商用、图片分辨率、内容生产质量等。
- 软件订阅付费
这也是ChatGPT等产品的盈利方式之一:向用户每月/年收取固定费用。目前,该营收模式在市场上的占有率约为10%。
- 模型定制开发费用
这是一种传统的项目开发合作模式,适用于为特定客户定制模型开发。预计到2027年,该营收模式的规模占比将从25%下降至13%。
- 其他模式
其他模式包括广告/流量模式,依靠产品的某些特点吸引用户点击,从中获得流量收益。这种模式属于小型营收,在市场规模中所占比例目前暂不予考虑。
AIGC赛道上有多种营收模式,从模型即服务、按内容产出量收费,到软件订阅付费和模型定制开发费用等,每种模式都有其适用的层次和场景。随着市场的发展,不同营收模式的比例也会发生变化。
十、 AI的三大短板
在《AI未来进行式》一书中,创新工场CEO李开复深入分析了人工智能的三大短板,并预言即使到了2042年,这些短板仍未必能被克服。这三大短板也是我们人类的长板,包括创造力、同理心和灵巧性。
- 创造力
创造力是人类的独特天赋,是我们在创造新的想法、艺术作品、科技突破和社会进步方面的重要能力。然而,人工智能在这方面存在短板。虽然AI可以通过学习大量数据进行创新性的输出,但它缺乏自主的创造力和构思能力。AI无法像人类一样进行战略性规划,也难以拥有真正的创意,无法做出对人类来说不言自明的常识性决策。
- 同理心
同理心是人类与他人建立情感连接和理解的能力,它使我们能够感同身受、体会他人的情感和需要。然而,AI并不具备情感和情感理解能力,它缺乏同情和关爱等情感。虽然AI可以通过算法模拟人类情感的表达,但它并不能真正感受到情感,无法在情感上与人类真正互动和给予关怀。
- 灵巧性
灵巧性是指人类在执行精确且复杂的体力工作方面的能力,同时具备感知非结构化空间和执行任务的能力。然而,目前的AI及机器人技术在这方面还存在局限性。虽然AI在特定任务上能够展现出惊人的准确性和效率,但它仍然难以像人类一样在复杂的环境中灵活应对和执行任务。
虽然人工智能在许多领域取得了重大突破,并将继续带来巨大的科技进步和社会变革,但这三大短板也反映了人类作为生物的优势。在未来,我们可能会通过更深入的研究和技术进步逐渐弥补其中的一些缺失,但要完全超越这些短板,可能仍需时日。人工智能与人类的结合将是未来发展的一个重要方向,我们可以借助AI的优势来弥补人类的不足,共同推动社会的进步和发展。
© 版权声明
文章版权归作者所有,未经允许请勿转载。