会微积分的喵

我走得很慢,但我从不后退

写在前面

本篇博客写的是关于大疆机器学习岗位的笔试题B卷(分两次考试:A卷和B卷),对其他岗位不具有参考性。今年的大疆笔试题题量大(单选,多选,填空,问答,编程),时间却很短(1个小时),可以说是时间短,题目多。好多人都没有做完,包括我。不说了,趁着刚做完,把题目做一个记录,题目来自于一些同学的拍照和自己的记忆。

题目

单选题

阅读全文 »

条件概率

我们平常所遇到的绝大多数概率都是有条件的。
定义:设有两个事件A、B,$P(B) \neq 0$,那么在给定B发生的条件下A发生的概率记为$P(A|B)$。
计算公式:$P(A|B) = \frac{P(AB)}{P(B)}$
理解:试验有N个结果(等可能的)
A: $M{1}$个
B: $M
{2}$个
AB: 共有$M{12}$个
若Bf发生,则现在新的样本空间为$M
{2}$个,则:

阅读全文 »

题目描述

我们规定对一个字符串的shift操作如下:
shift(“ABCD”, 0) = “ABCD”
shift(“ABCD”, 1) = “BCDA”
shift(“ABCD”, 2) = “CDAB”
换言之, 我们把最左侧的N个字符剪切下来, 按序附加到了右侧。
给定一个长度为n的字符串,我们规定最多可以进行n次向左的循环shift操作。如果shift(string, x) = string (0<= x <n), 我们称其为一次匹配(match)。求在shift过程中出现匹配的次数。

阅读全文 »

写在前面

昨天下午百度SRE(Search Reliability Engineering)部门提前批来我们学校宣讲了,听了宣讲后回来晚上在线投递了简历。提前批不影响后续的秋招,所以投下试试,没想到今天上午就接到了电话面试,不得不说效率还是很高的。下面就面试的主要问题做一个简单的记录。

一面(电话面试)

线程与进程的区别

(1)一个程序至少有一个进程,一个进程至少有一个线程.
(2)线程的划分尺度小于进程,使得多线程程序的并发性高。
(3)进程在执行过程中拥有独立的内存单元,而多个线程共享内存,从而极大地提高了程序的运行效率。

阅读全文 »

题目描述

头条的2017校招开始了!为了这次校招,我们组织了一个规模宏大的出题团队。每个出题人都出了一些有趣的题目,而我们现在想把这些题目组合成若干场考试出来。在选题之前,我们对题目进行了盲审,并定出了每道题的难度系数。一场考试包含3道开放性题目,假设他们的难度从小到大分别为a, b, c,我们希望这3道题能满足下列条件:
a<= b<= c
b - a<= 10
c - b<= 10
所有出题人一共出了n道开放性题目。现在我们想把这n道题分布到若干场考试中(1场或多场,每道题都必须使用且只能用一次),然而由于上述条件的限制,可能有一些考试没法凑够3道题,因此出题人就需要多出一些适当难度的题目来让每场考试都达到要求。然而我们出题已经出得很累了,你能计算出我们最少还需要再出几道题吗?

阅读全文 »

为什么需要降维

当处理真实问题和真实数据时,我们往往遇到维度高达数百万的高维数据,而高维情形下会出现样本稀疏、计算困难等问题,这是所有机器学习方法共同面临的严重障碍,被称为“维数灾难”。通过降维,在尽可能保留原数据信息的同时,可以使得计算复杂度变低,模型迭代更快,可以应用在性能比精度重要的一些场景。

高维数据可视化是困难的,通过降维,我们可以将数据映射到低维空间,便于可视化,可以对数据有一个直观感受。

为什么可以降维

  • 数据存在冗余,要么有一些没有用的信息,要么有一些重复的信息
  • 消除特征之间的相关性,并发现一些潜在的特征变量
  • 降维可以保留原始数据的主要信息,却极大降低了计算量、时间和资源
阅读全文 »

题目描述

给定一个正整数,编写程序计算有多少对质数的和等于输入的这个正整数,并输出结果。输入值小于1000。
如,输入为10, 程序应该输出结果为2。(共有两对质数的和为10,分别为(5,5),(3,7))

输入描述

输入包括一个整数n,(3 ≤ n < 1000)

输出描述

输出对数

阅读全文 »

题目描述

小易去附近的商店买苹果,奸诈的商贩使用了捆绑交易,只提供6个每袋和8个每袋的包装(包装不可拆分)。 可是小易现在只想购买恰好n个苹果,小易想购买尽量少的袋数方便携带。如果不能购买恰好n个苹果,小易将不会购买。

输入描述

输入一个整数n,表示小易想购买n(1 ≤ n ≤ 100)个苹果

阅读全文 »
0%