转录数字 - Amazon Transcribe
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

转录数字

使用 StartTranscriptionJob 操作中,数字被转录为数字,而不是以下语言的单词:

  • 澳大利亚英语 (en-AU)

  • 英国英语 (en-GB)

  • 印度英语 (en-IN)

  • 爱尔兰英语 (en-IE)

  • 苏格兰英语 (en-AB)

  • 美国英语 (en-US)

  • 威尔士英语 (en-WL)

  • 德语 (de-DE)

  • 瑞士德语 (de-CH)

对于流式转录,数字被转录为以下语言的数字:

  • 澳大利亚英语 (en-AU)

  • 英国英语 (en-GB)

  • 美国英语 (en-US)

对于前述语言,口号“壹仟贰佰肆拾贰”转录为1242。对于所有其他语言,数字被转录为单词形式。

英文数字转录规则

对于所有英语语言,如英国英语(英文-GB)或美国英语(英文-美国),根据以下规则转录数字。

Rule 示例
将大于 10 的基数词转换成数字。
  • “Fifty five”> 55

  • “a hundred”> 100

  • “One thousand and thirty one”> 1031

  • "One hundred twenty-three million four hundred fifty six thousand seven hundred eight nine" > 123456789

当“million”或“billion”后面没有数字时,将后跟“million”或“billion”的基数词转换为数字后跟一个单词。
  • "one hundred million" > 100 million

  • "one billion" > 1 billion

  • "two point three million" > 2.3 million

将大于 10 的序数词转换成数字。

  • “Forty third”> 43rd

  • “twenty sixth avenue”> 26th avenue

将小数转换成数字格式。

  • “a quarter”> 1/4

  • “three sixteenths”> 3/16

  • “a half”> 1/2

  • "a hundredth" > 1/100

将小于 10 的数字转换成阿拉伯数字(如果一行中有多个数字的话)。
  • “three four five”> 345

  • “My phone number is four two five five five five one two one two”> 4255551212

小数点由“dot”或“point”表示。
  • “three hundred and three dot five”> 303.5

  • “three point twenty three”> 3.23

  • “zero point four”> 0.4

  • “point three”> 0.3

将单词“percent”转换成数字加百分比符号 (%)。

  • “twenty three percent”> 23%

  • “twenty three point four five percent”> 23.45%

将数字后面的单词“dollar”、“Australian dollar”、“AUD”、“US dollar”或“USD”转换成美元符号 ($) 加在数字之前。

  • “one dollar and fifteen cents”> $1.15

  • "twenty three USD" > $23

  • "twenty three Australian dollars" > $23

将数字后面的单词“pounds”、“British pounds”或“GDB“转换为英镑符号 (£) 加在数字之前。

  • "twenty three pounds" > £23

  • "I have two thousand pounds" > I have £2,000

  • "five pounds thirty three pence" > £5.33

将数字后面的单词“rupees”、“Indian rupees”或“INR”转换卢比符号 (₹) 加在数字之前。

  • "twenty three rupees" > ₹23

  • "fifty rupees thirty paise" > ₹50.30

将时间转换成数字。

  • “seven a m eastern standard time”> 7 a.m. eastern standard time

  • “twelve thirty p m”> 12:30 p.m.

将以两位数表示的年份组合成四位数的年份。

仅适用于 20、21 和 22 世纪的年份。

  • “nineteen sixty two”> 1962

  • “the year is twenty twelve”> the year is 2012

  • “twenty nineteen”> 2019

  • “twenty one thirty” > 2130

将日期转换成数字。
  • “May fifth twenty twelve”> May 5th 2012

  • “May five twenty twelve”> May 5 2012

  • “five May twenty twelve”> 5 May 2012

数字范围用单词“to”来分隔。

  • “twenty three to thirty seven”> 23 to 37

用德语转录数字的规则

对于德语(de-DE)和瑞士德语(de-CH),根据以下规则转录数字。

Rule 示例
将大于 10 的基数词转换成数字。
  • "fünfundfünfzig" > 55

  • "vier tausend sechs hundert einundachtzig" > 4681

  • "eine Sache" > "eine Sache"

当“million”或“billion”后面没有数字时,将后跟“million”或“billion”的基数词转换为数字后跟一个单词。
  • "zehn Millionen Menschen" > 10 Millionen Menschen

  • "zehn Millionen fünf hundert tausend" > 10.500.000

将大于 10 的序数词转换成数字。

  • "dreiundzwanzigste" > 23.

  • "vierzigster" > 40.

  • "ich war Erster" > "ich war Erster"

分数不会转换为数值格式。

  • "ein Drittel" > "ein Drittel"

将小于 10 的数字转换成阿拉伯数字(如果一行中有多个数字的话)。
  • "eins zwei drei" > 123

  • "plus vier neun zwei vier eins" > +49241

小数由“,”表示。
  • "zweiundzwanzig komma drei" > 22,3

将单词“percent”转换成数字加百分比符号 (%)。

  • "fünf Prozent Hürde" > 5 % Hürde

  • "dreiundzwanzig komma vier Prozent" > 23,4%

将“欧元”转换为欧元符号。

  • "ein euro" > 1 €

  • "ein Euro vierzig" > 1,40 €

  • "ein Euro vierzig Cent" > 1,40 €

将时间转换成数字。

  • "vierzehn Uhr fünfzehn" > 14:15 Uhr

将日期转换成数字。
  • "dritter Dezember neunzehn hundert sechundfünfzig" > 3. Dezember 1956

显示斜线和破折号。

  • "55 Schrägstrich 13" > 55/13

  • "55 Strich 13" > 55-13

显示编号段落

  • "Paragraf 17" > § 17