转录数字和标点符号 - Amazon Transcribe
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

转录数字和标点符号

Amazon Transcribe 会自动向它支持的所有语言添加标点符号。它还针对写作系统中使用案例区分的语言适当地大写单词。例如,语音读出来的数字 “1,000 two two two two two two two two two two two two two two two two two two two two two two two two two two two two two two two two two two two two two 对于所有其他语言,数字会转录成各自语言的单词形式。

有关受支持的语言的列表,请参阅支持的语言和特定于语言的功能

用英语转录数字的规则

对于所有英语言,例如英国英语 (en-GB) 或美国英语 (en-US),数字是根据以下规则转录的。

Rule 示例
将大于 10 的基数词转换成数字。
  • “Fifty five”> 55

  • “a hundred”> 100

  • “One thousand and thirty one”> 1031

  • "One hundred twenty-three million four hundred fifty six thousand seven hundred eight nine" > 123456789

当“million”或“billion”后面没有数字时,将后跟“million”或“billion”的基数词转换为数字后跟一个单词。
  • "one hundred million" > 100 million

  • "one billion" > 1 billion

  • "two point three million" > 2.3 million

将大于 10 的序数词转换成数字。

  • “Forty third”> 43rd

  • “twenty sixth avenue”> 26th avenue

将小数转换成数字格式。

  • “a quarter”> 1/4

  • “three sixteenths”> 3/16

  • “a half”> 1/2

  • "a hundredth" > 1/100

将小于 10 的数字转换成阿拉伯数字(如果一行中有多个数字的话)。
  • “three four five”> 345

  • “My phone number is four two five five five five one two one two”> 4255551212

小数点由“dot”或“point”表示。
  • “three hundred and three dot five”> 303.5

  • “three point twenty three”> 3.23

  • “zero point four”> 0.4

  • “point three”> 0.3

将单词“percent”转换成数字加百分比符号 (%)。

  • “twenty three percent”> 23%

  • “twenty three point four five percent”> 23.45%

将数字后面的单词“dollar”、“Australian dollar”、“AUD”、“US dollar”或“USD”转换成美元符号 ($) 加在数字之前。

  • “one dollar and fifteen cents”> $1.15

  • "twenty three USD" > $23

  • "twenty three Australian dollars" > $23

将数字后面的单词“pounds”、“British pounds”或“GDB“转换为英镑符号 (£) 加在数字之前。

  • "twenty three pounds" > £23

  • "I have two thousand pounds" > I have £2,000

  • "five pounds thirty three pence" > £5.33

将数字后面的单词“rupees”、“Indian rupees”或“INR”转换卢比符号 (₹) 加在数字之前。

  • "twenty three rupees" > ₹23

  • "fifty rupees thirty paise" > ₹50.30

将时间转换成数字。

  • “seven a m eastern standard time”> 7 a.m. eastern standard time

  • “twelve thirty p m”> 12:30 p.m.

将以两位数表示的年份组合成四位数的年份。

仅适用于 20、21 和 22 世纪的年份。

  • “nineteen sixty two”> 1962

  • “the year is twenty twelve”> the year is 2012

  • “twenty nineteen”> 2019

  • “twenty one thirty” > 2130

将日期转换成数字。
  • “May fifth twenty twelve”> May 5th 2012

  • “May five twenty twelve”> May 5 2012

  • “five May twenty twelve”> 5 May 2012

数字范围用单词“to”来分隔。

  • “twenty three to thirty seven”> 23 to 37

用德语转录数字的规则

对于德语(DE-DE)和瑞士德语(DE-CH),数字是根据以下规则进行转录的。

Rule 示例
将大于 10 的基数词转换成数字。
  • "fünfundfünfzig" > 55

  • "vier tausend sechs hundert einundachtzig" > 4681

  • "eine Sache" > "eine Sache"

当“million”或“billion”后面没有数字时,将后跟“million”或“billion”的基数词转换为数字后跟一个单词。
  • "zehn Millionen Menschen" > 10 Millionen Menschen

  • "zehn Millionen fünf hundert tausend" > 10.500.000

将大于 10 的序数词转换成数字。

  • "dreiundzwanzigste" > 23.

  • "vierzigster" > 40.

  • "ich war Erster" > "ich war Erster"

分数不会转换为数字格式。

  • "ein Drittel" > "ein Drittel"

将小于 10 的数字转换成阿拉伯数字(如果一行中有多个数字的话)。
  • "eins zwei drei" > 123

  • "plus vier neun zwei vier eins" > +49241

小数点由 “,” 表示。
  • "zweiundzwanzig komma drei" > 22,3

将单词“percent”转换成数字加百分比符号 (%)。

  • "fünf Prozent Hürde" > 5 % Hürde

  • "dreiundzwanzig komma vier Prozent" > 23,4%

将单词 “欧元” 转换为欧元符号。

  • "ein euro" > 1 €

  • "ein Euro vierzig" > 1,40 €

  • "ein Euro vierzig Cent" > 1,40 €

将时间转换成数字。

  • "vierzehn Uhr fünfzehn" > 14:15 Uhr

将日期转换成数字。
  • "dritter Dezember neunzehn hundert sechundfünfzig" > 3. Dezember 1956

显示斜杠和破折号。

  • "55 Schrägstrich 13" > 55/13

  • "55 Strich 13" > 55-13

显示编号段落

  • "Paragraf 17" > § 17