通義千問(wèn)的Token限制與其大模型的計(jì)費(fèi)機(jī)制密切相關(guān),對(duì)于中文文本,1個(gè)token大約對(duì)應(yīng)1至1.8個(gè)漢字;而對(duì)于英文文本,通常1個(gè)token對(duì)應(yīng)3至4個(gè)字母或一個(gè)單詞。用戶需要了解并合理控制自己輸入和輸出的Token量,以避免不必要的開支。
通義千問(wèn)的token限制是什么意思
答:通義千問(wèn)的token限制是指其模型服務(wù)根據(jù)輸入和輸出的token數(shù)量來(lái)進(jìn)行計(jì)量和計(jì)費(fèi),token可以被視為自然語(yǔ)言文本的基本單位,類似于“字”或“詞”。
一、基本定義
1、Token的定義:Token是模型用來(lái)表示自然語(yǔ)言文本的基本單位。在中文中,一個(gè)Token平均對(duì)應(yīng)1.5-1.8個(gè)漢字;在英文中,則通常對(duì)應(yīng)一個(gè)單詞或詞根。
2、計(jì)量意義:通義千問(wèn)模型服務(wù)依據(jù)輸入和輸出的Token數(shù)量來(lái)計(jì)費(fèi)。每次模型調(diào)用產(chǎn)生的實(shí)際Token數(shù)量可以通過(guò)API響應(yīng)獲取。
二、技術(shù)基礎(chǔ)
1、分詞策略:將文本轉(zhuǎn)換為Token的過(guò)程包括分詞和編碼兩個(gè)步驟。分詞策略有按詞切分、按字符切分和按子詞切分。
2、編碼過(guò)程:文本通過(guò)分詞器被切分為Tokens,然后這些Tokens會(huì)映射到對(duì)應(yīng)的Token ID。不同的模型和服務(wù)可能有不同切分策略和標(biāo)準(zhǔn)。
三、計(jì)費(fèi)模式
1、收費(fèi)單元:通義千問(wèn)的多個(gè)版本都是以Token為基本計(jì)費(fèi)單位,不同規(guī)格的模型對(duì)應(yīng)不同的價(jià)格。
2、免費(fèi)額度:新用戶開通后可自動(dòng)獲得一定量的免費(fèi)Token使用額度,有效期通常為30天。
四、實(shí)用工具
1、SDK支持:開發(fā)者可以使用SDK在本地查看經(jīng)過(guò)通義千問(wèn)模型切分后的Token數(shù)據(jù),便于預(yù)估Token量。
2、計(jì)算器:用戶可以使用Token計(jì)算器或調(diào)用Token計(jì)算API來(lái)預(yù)估文本對(duì)應(yīng)的Token數(shù)量,從而控制成本。