转录数字 - Amazon Transcribe
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

转录数字

当您使用 StartTranscriptionJob 操作转录美国英语、澳大利亚英语、英国英语或印度英语音频时,数值将转录为数字而不是单词。对于流式转录,仅为美国英语和英国英语将数值转录为数字。例如,语音读出来的数字“one thousand two hundred forty-two”会转录成 1242。

所有其他语言的数字则会转录成各自语言的单词形式。

数字的转录遵循以下规则:

规则 描述
将大于 10 的基数词转换成数字。
  • “Fifty five”> 55

  • “a hundred”> 100

  • “One thousand and thirty one”> 1031

  • "One hundred twenty-three million four hundred fifty six thousand seven hundred eight nine" > 123456789

当“million”或“billion”后面没有数字时,将后跟“million”或“billion”的基数词转换为数字后跟一个单词。
  • "one hundred million" > 100 million

  • "one billion" > 1 billion

  • "two point three million" > 2.3 million

将大于 10 的序数词转换成数字。

  • “Forty third”> 43rd

  • “twenty sixth avenue”> 26th avenue

将小数转换成数字格式。

  • “a quarter”> 1/4

  • “three sixteenths”> 3/16

  • “a half”> 1/2

  • "a hundredth" > 1/100

将小于 10 的数字转换成阿拉伯数字(如果一行中有多个数字的话)。
  • “three four five”> 345

  • “My phone number is four two five five five five one two one two”> 4255551212

小数点由“dot”或“point”表示。
  • “three hundred and three dot five”> 303.5

  • “three point twenty three”> 3.23

  • “zero point four”> 0.4

  • “point three”> 0.3

将单词“percent”转换成数字加百分比符号 (%)。

  • “twenty three percent”> 23%

  • “twenty three point four five percent”> 23.45%

将数字后面的单词“dollar”、“Australian dollar”、“AUD”、“US dollar”或“USD”转换成美元符号 ($) 加在数字之前。

  • “one dollar and fifteen cents”> $1.15

  • "twenty three USD" > $23

  • "twenty three Australian dollars" > $23

将数字后面的单词“pounds”、“British pounds”或“GDB“转换为英镑符号 (£) 加在数字之前。

  • "twenty three pounds" > £23

  • "I have two thousand pounds" > I have £2,000

  • "five pounds thirty three pence" > £5.33

将数字后面的单词“rupees”、“Indian rupees”或“INR”转换卢比符号 (₹) 加在数字之前。

  • "twenty three rupees" > ₹23

  • "fifty rupees thirty paise" > ₹50.30

将时间转换成数字。

  • “seven a m eastern standard time”> 7 a.m. eastern standard time

  • “twelve thirty p m”> 12:30 p.m.

将以两位数表示的年份组合成四位数的年份。

仅适用于 20、21 和 22 世纪的年份。

  • “nineteen sixty two”> 1962

  • “the year is twenty twelve”> the year is 2012

  • “twenty nineteen”> 2019

  • “twenty one thirty” > 2130

将日期转换成数字。
  • “May fifth twenty twelve”> May 5th 2012

  • “May five twenty twelve”> May 5 2012

  • “five May twenty twelve”> 5 May 2012

数字范围用单词“to”来分隔。

  • “twenty three to thirty seven”> 23 to 37