【校招VIP】前端算法之大数据相关算法

04月21日 收藏 0 评论 0 前端开发

【校招VIP】前端算法之大数据相关算法

考点介绍:

大数据的关键技术分为分析技术和处理技术,可用于大数据分析的关键技术主要包括A/B测试,关联规则挖掘,数据挖掘,集成学习,遗传算法,机器学习,自然语言处理,模式识别,预测模型,信号处理,空间分析,监督式学习,时间序列分析等,可用于大数据处理的关键技术主要是商业智能,云计算,数据仓库,数据集市,分布式系统,元数据,非关系型数据库,非结构化数据,半结构化数据,SOL,流处理和可视化技术等。

答案详情和文章内容扫描海报二维码或者点击文末链接查看!

一、考点题目

1.给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,找出a、b文件共同的url

解答: 先计算总的数据大小,看能不能一次性放到内存里……

2.从2.5亿个整数中找出不重复的整数,内存不足以容纳这2.5亿个整数 Vuex中如何异步修改状态?

解答:思路一,使用例一的思路,切分成小文件,后面对每个小文件逐一比较 .……

3.一个分布式系统的海量数据分布在100台服务器中,怎么统计出这些数据的TOP10

解答:先对每台服务器的数据求得各自的TOP10,然后把100*10= 1000个数据求得TOP10即可 ……

4. 要从1000个数据元素中选五个最小的,下面排序算法中,那个算法最快?()

A.希尔排序

B.快速排序

C.堆排序

D.简单选择排序

解答: C简单选择排序,每轮选出最小的一个元素,那么5轮就完成了任务,比较次数为1000+999+998+997+996=5000-10=4990次。……

二、考点文章

大数据平台模型数据算法总结

“大数据平台数据来源于企业内部、外部各个源系统,包括企业内部的前端人工输入、智能设备采集、app端埋点日志、外部数据采购等等等等,可以说是千奇百怪五花八门,从以前的CDS到数据仓库,再到数据湖、数据中台,整个企业内部数据流向就如同一条条毛细血管中的血液,由全身各处流向心脏,在做有氧交换,处理、加工、汇总、分析再分发到需要他的地方。这个比喻可能有失偏颇,但是大致就是这么个意思吧。”

三、考点视频

直接插入排序和最佳复杂度

本题是校招的常见考点之一,这里考察的是简单排序的直播插入排序。首先要对熟悉排序算法本身,不要把选择和插入搞混,其次是针对每一轮的排序,考虑最少的比较次数是多少

(考点视频扫海报二维码即可查看)

pc端专题链接: https://xiaozhao.vip/dTopic/detail/230

移动端专题链接:https://m.xiaozhao.vip/dTopic/detail/230

C 0条回复 评论

帖子还没人回复快来抢沙发