0%

随机事件

基本定义

随机事件:

  • 随机现象的一切可能基本结果组成的集合称为样本空间,记为$\Omega=\left\{ \omega \right\}$,其中$\omega$为基本结果,又称为样本点
  • 随机现象的某些样本点组成的集合称为随机事件,常用大写字母$A,B,C,…$表示。由样本空间$\Omega$中的单个元素组成的子集称为基本事件
  • 如果$A$与$B$没有相同的样本点,则称$A$与$B$
  • 事件$A$的对立事件$\bar{A}$,由在$\Omega$中而不在$A$中的样本点组成的新事件。
  • 德摩根律:$\bar{A\cup B}=\bar{A}\cap\bar{B}$
阅读全文 »

线性模型的推导(参考自西瓜书)

原问题:假设有$m$个样本$D=\left\{(\mathbf{x}_{1},y_{1}),(\mathbf{x}_{2},y_{2}),…,(\mathbf{x}_{m},y_{m}) \right\}$,每个样本$\mathbf{x}_{i}=\left ( x_{1},x_{2},…,x_{d} \right )$有$d$个特征,一个目标值$y_{i}=y$

阅读全文 »

python类特殊方法

  1. __init__ 和 __new__

    init方法不是类的构造方法,其作用是返回实例,new方法才是类的构造方法,通过继承object类重写改方法

  2. __enter__ 和 __exit__

    enter作用是初始化后返回实例,exit作用是退出with语句后做处理,例如清理内存,关闭文件,删除冗余等

  3. __str__ 和 __repr__

    str方法是用于将实例的信息以字符串的形式输出,repr方法与str作用相同,不同在于repr方法用于交互式环境调试

  4. __setattr__ 、__getattr__、__getattribute__ 、__delattr__

    setattr用于设置属性,getattr用于获取不存在的属性,getattribute用于访问存在的属性,delattr用于删除属性

阅读全文 »

导入必要的包(package)

若没有下列的包,可使用pip install 包名命令安装

  • re: 使用正则表达式
  • json: 解析json内容
  • time: 爬虫间歇时间控制
  • jieba: 中文分词库
  • urlib: 将中文关键字编码(百分号+数字)
  • requests: 向网站发出请求
  • bs4: 解析网页内容
  • wordcloud: 生成词云
阅读全文 »

二叉排序树

二叉排序树又称为二叉查找树(Binary Sort Tree or Binary Search Tree, 简称BST),或者是一颗空树,或者是具有下列性质的二叉树:

阅读全文 »

$k$近邻算法

$k$近邻(k-Nearest Neighbor, KNN)分类算法,是机器学习中最简单的算法之一。该算法的基本思路是:在一个未知的样本附近选取k个距离最短的已知样本(有类别标签),将这k个已知样本中数量最多的类别(标签)作为未知样本的类别(标签)。直观一点,如下图所示:
knn示例
可以看到上图选取了$k=5$个距离未知样本最近的已知样本,5个已知样本中有三个红色矩形和两个蓝色矩形,由算法的基本思路可知,未知样本应标记为红色

阅读全文 »

在介绍哈希表之前,先介绍一下查找表

查找表(Search Table)

查找表是由同一类型的数据元素(或记录)构成的集合。由于“集合”中的数据元素之间存在着完全松散的关系,因此查找表是一种非常灵活的数据结构

阅读全文 »

连续分配存储管理方式

该分配方式为用户程序分配一个连续的内存空间,即程序中代码或数据的逻辑地址相邻,体现在内存空间分配是物理地址的相邻。连续分配方式可分为四类:

阅读全文 »

引言

银行家算法是一种避免进程发生死锁的算法。

死锁的定义:
如果一组进程中的每一个进程都在等待仅由该组进程中的其它进程才能引发的事件,那么改组进程是死锁的(Deadlock)
在死锁避免方法中,把系统的状态分为安全状态不安全状态
安全状态和不安全状态:
是指系统能按某种进程推进顺序 为每个进程分配其所需资源,直至满足每个进程对资源的最大需求,使每个进程都可顺利地完成。并称为安全序列。如果系统无法找到这样一个安全序列,则称系统处于不安全状态。

阅读全文 »