|
|
|
@ -56,11 +56,11 @@ spark = SparkSession \
|
|
|
|
|
|
|
|
|
|
`regexp` 是正则表达式;
|
|
|
|
|
|
|
|
|
|
`idx`是返回结果 取表达式的哪一部分 默认值为1;
|
|
|
|
|
`idx`是返回结果,取表达式的哪一部分默认值为`1`;
|
|
|
|
|
|
|
|
|
|
`0`表示把整个正则表达式对应的结果全部返回;
|
|
|
|
|
|
|
|
|
|
`1`表示返回正则表达式中第一个() 对应的结果 以此类推 。
|
|
|
|
|
`1`表示返回正则表达式中第一个()对应的结果,以此类推 。
|
|
|
|
|
|
|
|
|
|
示例:
|
|
|
|
|
1)`select regexp_extract('hitdecisiondlist','(i)(.*?)(e)',0) ;`
|
|
|
|
@ -98,7 +98,9 @@ REPLACE函数:( string_replace1 , string_replace2 , string_replace3 )
|
|
|
|
|
本例可使用如下表达式:
|
|
|
|
|
`cast(replace(regexp_extract(`最大飞行速度`,'[\\\d,\\\.]+',0),',','') as float)`
|
|
|
|
|
|
|
|
|
|
第四步:使用降序输出前三
|
|
|
|
|
第四步:使用降序输出前三。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5.将处理结果保存到本地目录;
|
|
|
|
|
|
|
|
|
|