登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
业界
›
大模型 Token 究竟是啥:图解大模型Token
大模型 Token 究竟是啥:图解大模型Token
[ 复制链接 ]
茹静曼
2025-6-3 10:46:39
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
前几天,一个朋友问我:“
大模型
中的
Token
究竟是什么?”
这确实是一个很有代表性的问题。许多人听说过 Token 这个概念,但未必真正理解它的作用和意义。思考之后,我决定写篇文章,详细解释这个话题。
我说:像
DeepSeek
和
ChatGPT
这样的超大语言模型,都有一个“刀法精湛”的小弟——
分词器(
Tokenizer
)
。
当
大模型
接
收到一段文字
。
会让
分词器
把它
切成很多个小块
。
这切出来的每一个小块就叫做一个
Token
。
比如这段话(
我喜欢唱、跳、Rap和篮球
),在大模型里可能会被切成这个样子。
像
单个汉字
,可能是一个
Token
。
两个汉字
构成的
词语
,也可能是一个
Token
。
三个字
构成的
常见短语
,也可能是一个
Token
。
一个标点符号
,也可能是一个
Token
。
一个单词
,或者是
几个字母
组成的一个
词缀
,也可能是一个
Token
。
大模型在输出文字的时候,也是一个 Token 一个 Token 的往外蹦,所以看起来可能有点像在打字一样。
朋友听完以后,好像更疑惑了:
于是,我决定换一个方式,给他通俗解释一下。
大模型的Token究竟是啥,以及为什么会是这样。
首先,请大家快速读一下这几个字:
是不是有点没有认出来,或者是需要愣两秒才可以认出来?
但是如果这些字出现在
词语
或者
成语
里,你
瞬间
就可以念出来。
那之所以会这样,是因为我们的
大脑在日常生活中
,
喜欢
把这些有含义的
词语
或者
短语
,优先作为
一个整体
来对待。
不到万不得已,不会去一个字一个字的抠。
这就导致我们对这些
词语还挺熟悉
,
单看
这些字(旯妁圳侈邯)的时候,反而会觉得
有点陌生
。
而大脑
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
大模型
Token
竟是
图解
相关帖子
【有手就行】LoRA:用你自己的数据来微调大模型,让大模型真正懂你
解密Prompt系列66. 视觉Token爆炸→DeepSeek-OCR光学压缩
纯前端调用大模型真的安全吗?我踩过的坑比示例代码多得多
UniEdit:首个大型开放域大模型知识编辑基准
大模型榜单周报(2025/12/08—2025/12/12)
一个完全由大模型AI Coding开发而成的程序员工具网站
仅通过一句提示词,就可以让大模型变得更有创造力
变天了!字节vs阿里大模型正面硬刚,双人视频一键生成?实测结果太意外...
大模型榜单周报(2025/12/20)
【有手就行】SWIFT:花20分钟把大模型的名字变成你的名字
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
【有手就行】LoRA:用你自己的数据来微调大模型,让大模型真正懂你
0
955
晖顶蝇
2025-12-14
业界
解密Prompt系列66. 视觉Token爆炸→DeepSeek-OCR光学压缩
0
428
筒霓暄
2025-12-15
安全
纯前端调用大模型真的安全吗?我踩过的坑比示例代码多得多
0
959
静轾
2025-12-16
业界
UniEdit:首个大型开放域大模型知识编辑基准
0
996
焦和玉
2025-12-16
业界
大模型榜单周报(2025/12/08—2025/12/12)
1
199
赐度虻
2025-12-16
业界
一个完全由大模型AI Coding开发而成的程序员工具网站
0
480
龙梨丝
2025-12-17
安全
仅通过一句提示词,就可以让大模型变得更有创造力
0
312
讣丢
2025-12-17
安全
变天了!字节vs阿里大模型正面硬刚,双人视频一键生成?实测结果太意外...
0
377
毕余馥
2025-12-18
业界
大模型榜单周报(2025/12/20)
0
481
簑威龙
2025-12-20
业界
【有手就行】SWIFT:花20分钟把大模型的名字变成你的名字
0
490
准挝
2025-12-21
回复
(8)
宇文之
2025-10-13 08:20:43
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
很好很强大 我过来先占个楼 待编辑
庾芷秋
2025-10-19 12:38:03
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
分享、互助 让互联网精神温暖你我
但婆
2025-10-20 04:32:32
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
懂技术并乐意极积无私分享的人越来越少。珍惜
吕颐然
2025-10-30 12:33:53
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
分享、互助 让互联网精神温暖你我
硫辨姥
2025-11-14 03:30:04
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
这个好,看起来很实用
玲液
2025-12-7 05:25:18
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
前排留名,哈哈哈
禄磊
2025-12-9 13:40:30
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢,下载保存了
讥慰捷
2025-12-11 14:30:05
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
鼓励转贴优秀软件安全工具和文档!
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
茹静曼
2025-12-11 14:30:05
关注
0
粉丝关注
17
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991124
anyue1937
9994892
kk14977
6845357
4
xiangqian
638210
5
韶又彤
9997
6
宋子
9981
7
闰咄阅
9993
8
刎唇
9993
9
俞瑛瑶
9998
10
蓬森莉
9950
查看更多
今日好文热榜
490
【有手就行】SWIFT:花20分钟把大模型的名
559
论文速读记录 | 2025.12(2)
371
浮点数的本质:为什么计算机无法精确表示0.
726
Flink源码阅读:如何生成JobGraph
926
Python 潮流周刊#132:30 年 Python 自由职
480
大模型榜单周报(2025/12/20)
154
【节点】[LinearToGammaSpaceExact节点]原
789
Aspire 与 Azure Functions 深度集成:架构
1002
阿里Z-Image图像生成模型容器部署
309
痞子衡嵌入式:16MB以上NOR Flash地址模式
668
最新AI换脸软件,全面升级可直播,Mirage下
450
热点 Key 与大 Key 治理——识别、拆分、预
646
Media Extended
329
vlookup的终结者splookup,9个案例讲透查询
872
ROS2之Launch介绍
895
精选 8 个 .NET 开发实用的类库,效率提升
110
精选 8 个 .NET 开发实用的类库,效率提升
599
精选 8 个 .NET 开发实用的类库,效率提升
173
精选 8 个 .NET 开发实用的类库,效率提升
119
精选 8 个 .NET 开发实用的类库,效率提升