FormatPhoneNumber 类 - Amazon Glue
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

FormatPhoneNumber 类

FormatPhoneNumber 转换会返回一列,其中将电话号码字符串转换为格式化值。

示例

from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) input_df = spark.createDataFrame( [ ("408-341-5669",), ("4083415669",) ], ["phone"], ) try: df_output = column_formatting.FormatPhoneNumber.apply( data_frame=input_df, spark_context=sc, source_column="phone", default_region="US" ) df_output.show() except: print("Unexpected Error happened ") raise

输出

输出是:

``` +---------------+ | phone| +---------------+ |(408) 341-5669| |(408) 341-5669| +---------------+ ```

FormatPhoneNumber 转换会将“source_column”设为“"phone"”,将“default_region”设为“"US"”。

该转换可成功地将两个电话号码(无论其初始格式如何)格式化为标准的美国格式“(408) 341-5669”。

方法

__call__(spark_context, data_frame, source_column, phone_number_format=None, default_region=None, default_region_column=None)

FormatPhoneNumber 转换会返回一列,其中将电话号码字符串转换为格式化值。

  • source_column – 现有列的名称。

  • phone_number_format – 将电话号码转换为该格式。如果未指定格式,则默认为国际公认的标准电话号码格式 E.164。有效值包括:

    • E164(省略 E 之后的句点)

  • default_region – 由两个或三个大写字母组成的有效区域代码,当电话号码本身不包含国家/地区代码时,该代码将指定电话号码所在的地区。最多只能提供 defaultRegiondefaultRegionColumn 中的一个。

  • default_region_column – 高级数据类型 Country 的列的名称。当电话号码本身不包含国家/地区代码时,指定列中的区域代码将用于确定电话号码的国家/地区代码。最多只能提供 defaultRegiondefaultRegionColumn 中的一个。

apply(cls, *args, **kwargs)

继承自 GlueTransform apply

name(cls)

继承自 GlueTransform name

describeArgs(cls)

继承自 GlueTransform describeArgs

describeReturn(cls)

继承自 GlueTransform describeReturn

describeTransform(cls)

继承自 GlueTransform describeTransform

describeErrors(cls)

继承自 GlueTransform describeErrors

describe(cls)

继承自 GlueTransform describe