1 / 4
文档名称:

BAT数据工程师面试原题.docx

格式:docx   大小:15KB   页数:4页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

BAT数据工程师面试原题.docx

上传人:薇薇安 2021/9/16 文件大小:15 KB

下载得到文件列表

BAT数据工程师面试原题.docx

相关文档

文档介绍

文档介绍:SQL面试题
1. 用一条SQL 语句 查询出每门课都大于80 分的学生姓名(5分)
name kecheng fenshu
张三 语文 81
张三 数学 75
李四 语文 76
李四 数学 90
王五 语文 81
王五 数学 100
王五 英语 90
答案:
(5分)
表名 scores
num name score
111ﻩﻩtomﻩﻩ100
114ﻩﻩnickﻩﻩ89
112ﻩﻩrouseﻩ95
113ﻩ jery ﻩ89
116 ﻩmissﻩ83
排序结果:
nameﻩscoreﻩrank
tomﻩﻩ100ﻩﻩ1
rouseﻩ95ﻩﻩ2
nickﻩ 89ﻩﻩ3
jeryﻩﻩ89 ﻩ3
missﻩ83ﻩﻩ5
答案:
, 按muid分组,然后同muid组内按muid,time排序 (10分)
muidﻩchannelﻩﻩos time
242443391ﻩY1ﻩﻩandroidﻩ20150319
242443391ﻩY2 ﻩiOSﻩﻩ
ﻩY1ﻩ android 20150319
ﻩY3 ﻩiosﻩﻩ
ﻩY1ﻩﻩandroid 20150319
ﻩY4ﻩ iosﻩﻩ
预期结果:
channelﻩmuidﻩtimeﻩrank
Y1ﻩ2423391 20150319ﻩ1
Y4ﻩ 20150311ﻩ2
Y4ﻩ2424430391ﻩ20150323ﻩ1
Y2ﻩ2424430391ﻩ20150322ﻩ2
Y1ﻩ2424430391ﻩ20150312ﻩ3
Y2ﻩ242443391ﻩ20150320ﻩ1
Y1 242443391ﻩ20150319ﻩ2
答案:
4. 请说明hive中 Sort By,Order By,Cluster By,Distrbute By各代表什么意思(5分)
5. hive一行变多行 (5分)
表名 tb_split
dateﻩAﻩB
ﻩaaﻩ7|8|5
ﻩbbﻩ9|10|11
预期结果:
dateﻩAﻩB
ﻩaaﻩ7
ﻩaaﻩ8
ﻩaaﻩ5
ﻩbbﻩ9
bbﻩ10
ﻩbbﻩ11
答案:
:(10分)
table :包含订单id和每个订单的预估时长(eta)单位min
order_id eta
1234 10
2455   15
1355    30
实现结果:得到订单的eta分布且左边的eta的分段按照大小排列,
分段要求小于30分钟按照每5min间隔分段>=30min&<60min按照每10分钟分段,大于60分钟-300分钟 按照每30分钟分段,最后>=300分钟:
结果:
[ 0, 5) 订单数
[  5, 10)    订单数
.....
[ 30, 40)