1. 大模型的常见应用场景
1.1. 常见应用场景
应用场景 | 功能描述 | 用法示例 | 代表应用 |
---|---|---|---|
图像生成 | 根据文本描述或参考图生成高质量图片,支持艺术、写实等多种风格。 | 输入提示词(如“赛博朋克风格的城市夜景”),调整参数(分辨率、风格强度)。 | 即梦AI |
视频生成 | 从文本/图片生成视频,或对现有视频进行编辑(换脸、补帧、去水印)。 | 输入脚本或分镜描述,选择时长、画风;或上传视频后指定修改需求。 | 即梦AI AI视频绘图写作精灵 |
音乐生成 | 生成原创旋律、调整曲风(古典/电子)、匹配节奏或歌词。 | 输入情绪关键词(如“激昂”)、选择乐器组合,或上传旋律片段扩展。 | 即梦AI |
网页摘要 | 快速提取长文章/网页的核心观点,支持多语言和关键数据标记。 | 粘贴链接或文本,指定摘要长度(如“200字总结”)。 | 讯飞星火 |
帮我写作 | 生成/润色文案,覆盖邮件、报告、小说、代码注释等。 | 输入主题和框架(如“写一封求职信,突出Python技能”),迭代修改。 | 豆包 DeepSeek |
AI 搜索 | 语义理解搜索意图,整合多源信息并结构化呈现(如对比表格)。 | 直接提问复杂问题(如“对比iPhone 15和三星S24的电池续航”)。 | 豆包 DeepSeek |
AI 阅读 | 解析PDF/论文/书籍,提取摘要、术语解释,支持问答互动。 | 上传文档后提问(如“第三章的实验结论是什么?”)。 | 豆包 |
AI 翻译 | 高精度文本/语音翻译,保留专业术语和上下文语境。 | 输入文本或实时语音,选择领域(如“医学翻译”)。 | 豆包 |
AI 编程 | 代码生成、补全、调试,支持多语言(Python/JS等)和框架适配。 | 描述功能需求(如“用Python爬取微博热搜”),生成后人工优化。 | 豆包 DeepSeek |
解题答疑 | 解答数学题、编程题、科学问题,提供步骤拆解。 | 拍照或输入题目(如“求微分方程的通解”),获取分步解析。 | 豆包 |
学术搜索 | 精准检索论文、筛选高引文献,自动生成综述摘要。 | 输入研究主题(如“神经网络在医疗诊断中的应用”),过滤年份/期刊。 | 豆包 |
数据分析 | 自动清洗数据、生成可视化图表,预测趋势并输出报告。 | 上传Excel/CSV文件,用自然语言指令分析(如“预测下季度销售额”)。 | 豆包 |
语音通话 | 交互方式从文字变成了语音聊天的方式,有嘴说出你的需求,AI通过语音或文字的方式答复你。 | 接入通话后,AI自动记录重点并识别任务项。 | 豆包 |
PPT助手 | 根据大纲生成PPT,自动排版、配图,提供演讲备注。 | 输入主题(如“碳中和行业报告”),选择模板风格和页数。 | KiMi |
1.2. 常见的通用大模型
以下为国内外常用通用大模型的整理列表,按国内和国外分类,包含模型名称、简要介绍及官网地址(部分官网需通过企业主站访问):
1.2.1. 国内通用大模型
模型名称 | 简介 | 官网地址 |
---|---|---|
DeepSeek | 深度求索公司研发的高性能开源模型,以低成本、高推理能力著称,支持数学、代码等复杂任务。 | https://chat.deepseek.com/ |
豆包 | 字节跳动开发的智能语言模型,基于深度学习技术,支持多种自然语言处理任务。 | https://www.doubao.com/ |
Kimi | 月之暗面科技推出的长文本处理AI助手,擅长中英文对话、文件解析与信息整合。 | https://kimi.moonshot.cn/ |
通义千问 | 阿里巴巴研发的多模态大模型,支持跨领域知识理解与生成,综合性能强劲。 | https://tongyi.aliyun.com/ |
腾讯元宝 | 腾讯公司研发的多模态大模型,支持跨领域知识理解和生成,综合性能优越。 | https://yuanbao.tencent.com/chat/ |
文心一言 | 百度推出的生成式大模型,擅长诗歌创作、数学推理、专业领域问答等。 | https://yiyan.baidu.com/ |
讯飞星火 | 科大讯飞开发的智能助手,涵盖自然语言处理、语音识别与合成、机器翻译等功能。 | https://xinghuo.xfyun.cn/desk |
智谱清言 | 清华大学与智谱AI合作开发的大模型,以中文理解与生成能力见长,支持多轮对话。 | https://chatglm.cn/ |
1.2.2. 国外通用大模型
模型名称 | 简介 | 官网地址 |
---|---|---|
ChatGPT | OpenAI开发的对话式AI模型,支持多轮交互、代码生成与复杂问题解答,闭源但提供API服务。 | https://chat.openai.com/ |
Gemini | 谷歌推出的多模态大模型家族,包含通用型与专业型版本,擅长编程与复杂知识推理。 | https://gemini.google.com/ |
Grok | 马斯克旗下xAI开发的高性能模型,以数学推理与创意生成为特色,需订阅使用。 | https://grok.com/ |
2. 特定场景的AI工具
2.1. 即梦AI
- 所属公司: 字节跳动旗下剪映团队
- 工具简介: 即梦AI 即梦AI是一个专为创意爱好者打造的AI表达平台,让你的想象力成为现实。
- 主要功能: 生成图片、生成视频、生成音乐、智能画布、故事创作。
- 官网地址: https://jimeng.jianying.com/
- 特别说明: 目前(2025.02.12)每日赠送积分,个人低频使用的话,基本是够用的。
2.2. 可灵AI
- 所属公司: 快手公司旗下快手大模型团队
- 工具简介: 可灵AI是广受海内外创作者好评的新一代创意生产力平台,基于可灵大模型和可图大模型,提供视频、图片生成与编辑能力。
- 主要功能: 图像生成、视频生成。
- 官网地址: https://klingai.kuaishou.com/
- 特别说明: 整体体验下来,很多功能都需要收费,且功能没有即梦AI丰富。收费方式:会员+充值双重制度。
2.3. Vidu
- 所属公司: 北京生数科技
- 工具简介: 中国首个长时长、高一致性、高动态性视频大模型。
- 主要功能: 参考生视频、图生视频、文生视频。
- 官网地址: https://www.vidu.com/zh
- 特别说明: 目前(2025.02.12)只有网页版,没有APP。
2.4. 稿定设计
- 所属公司: 稿定设计是稿定(厦门)科技有限公司旗
- 工具简介: 图片海报视频PPT、H5设计制作,拼图抠图智能设计
- 主要功能: AI绘图、AI图片编辑(拼图、抠图、去水印)、海量设计模板。
- 官网地址: https://www.gaoding.com/
- 特别说明: 很多模板和功能是需要收费的,会员制收费。
2.5. 闪剪
- 所属公司: 深圳市趣推科技有限公司
- 工具简介: 闪剪是一款AI数字人口播视频生成工具,只需上传一段30 秒的视频,就能 1:1 复刻你的形象和声音,输入文字即可一键生成口播视频
- 主要功能: 定制数字人,通过文本生成口播视频,AI文案创作等。
- 官网地址: https://shanjian.tv/
- 特别说明: 部分功能需要收费,收费方式:会员制收费。
2.6. AI视频绘图写作精灵
- 所属公司: 北京墨樱科技有限公司
- 工具简介: 你只需要提供一句话描述,AI视频绘图写作精灵就能快速生成完整故事,并且根据故事内容自动生成视。很多玄幻类的视频短剧就是这个App生成的。
- 主要功能: 支持图生视频、口播视频、照片跳舞、一键成曲等功能。
- 特别说明: 几乎所有功能都需要付费,会员制收费。没找到官网,只有移动端App。
2.7. GammaPPT
- 所属公司: 深圳市向向桐信息技术有限公司
- 工具简介: GammaPPT是一款智能创新的PPT制作工具,致力于为广大用户提供便捷、高效的PPT制作体验。
- 主要功能: 一键生成PPT,AI编辑、美化、排版、导出、一键动效等。
- 官网地址: https://www.aippt.cn/
3. 还有哪些好用的工具?
这里推荐一个非常由意思的网站:AI工具集。
- 介绍: 它是收录各类AI工具的垂直门户网站,专注于收录和推荐国内外热门、创意、有趣、前沿的AI工具和网站,目前收录了1000+个AI工具。
- 功能: 对AI工具进行了详细的分类,可通过分类来查找需要的工具;还提供搜索功能,方便快捷检索。
- 网址: https://ai-bot.cn/