数据结构分类及八种常见数据结构- 校招VIP

文章申明：转载来源：https://blog.csdn.net/dfnkd/article/details/106013510

一.数据结构分类

数据的逻辑结构：
1.集合：数据结构中的元素之间除了“同属一个集合” 的相互关系外，别无其他关系；
2.线性结构：数据结构中的元素存在一对一的相互关系；
3.树形结构：数据结构中的元素存在一对多的相互关系；
4.图形结构：数据结构中的元素存在多对多的相互关系。

数据的存储结构：
顺序存储结构：数据元素在内存中的物理存储顺序与他们的逻辑顺序相同
链式存储结构：使用若干地址分散的存储单元存储数据元素，逻辑上相邻的数据元素在物理位置上不一定相邻，数据元素之间的关系需要采用附加信息特别指定。c语言采用指针，Java采用引用指定。

线性结构和非线性结构两类：
线性结构：最多只有一个直接前趋结点(第一个没有)和一个直接后继结点。栈、队列和串等都属于线性结构
非线性结构：可能有多个直接前趋结点和多个直接后继结点，数组、广义表、树结构和图

数据结构分类：
数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成。
常用的数据结构有：数组，栈，链表，队列，树，图，堆，散列表等，如图所示：

每一种数据结构都有着独特的数据存储方式，下面为大家介绍它们的结构和优缺点。

二.八种常见数据结构

1、数组

数组是可以再内存中连续存储多个元素的结构，在内存中的分配也是连续的，数组中的元素通过数组下标进行访问，数组下标从0开始。例如下面这段代码就是将数组的第一个元素赋值为 1。

int[] data = new int[100]；data[0] = 1;

优点：
1、按照索引查询元素速度快
2、按照索引遍历数组方便

缺点：
1、数组的大小固定后就无法扩容了
2、数组只能存储一种类型的数据
3、添加，删除的操作慢，因为要移动其他的元素。

适用场景：
频繁查询，对存储空间要求不大，很少增加和删除的情况。

2、栈

栈是一种特殊的线性表，仅能在线性表的一端操作，栈顶允许操作，栈底不允许操作。
栈的特点是：先进后出，或者说是后进先出，从栈顶放入元素的操作叫入栈，取出元素叫出栈。

栈的结构就像一个集装箱，越先放进去的东西越晚才能拿出来，所以，栈常应用于实现递归功能方面的场景，例如斐波那契数列。

3、队列

队列与栈一样，也是一种线性表，不同的是，队列可以在一端添加元素，在另一端取出元素，也就是：先进先出。
从一端放入元素的操作称为入队，取出元素为出队。
示例图如下：

使用场景：因为队列先进先出的特点，在多线程阻塞队列管理中非常适用。

4、链表

链表是物理存储单元上非连续的、非顺序的存储结构，数据元素的逻辑顺序是通过链表的指针地址实现，每个元素包含两个结点，一个是存储元素的数据域 (内存空间)，另一个是指向下一个结点地址的指针域。
根据指针的指向，链表能形成不同的结构。

例如单链表，双向链表，循环链表等。

优点：
链表是很常用的一种数据结构，不需要初始化容量，可以任意加减元素；
添加或者删除元素时只需要改变前后两个元素结点的指针域指向地址即可，所以添加，删除很快；

缺点：
因为含有大量的指针域，占用空间较大；
查找元素需要遍历链表来查找，非常耗时。

适用场景：
数据量较小，需要频繁增加，删除操作的场景

5、树

树是一种数据结构，它是由n（n>=1）个有限节点组成一个具有层次关系的集合。
把它叫做 “树” 是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。

它具有以下的特点：
每个节点有零个或多个子节点；
没有父节点的节点称为根节点；
每一个非根节点有且只有一个父节点；
除了根节点外，每个子节点可以分为多个不相交的子树；

在日常的应用中，我们讨论和用的更多的是树的其中一种结构，就是二叉树。

二叉树是树的特殊一种，具有如下特点：
1、每个结点最多有两颗子树，结点的度最大为2。
2、左子树和右子树是有顺序的，次序不能颠倒。
3、即使某结点只有一个子树，也要区分左右子树。

二叉树是一种比较有用的折中方案，它添加，删除元素都很快，并且在查找方面也有很多的算法优化。
所以，二叉树既有链表的好处，也有数组的好处，是两者的优化方案，在处理大批量的动态数据方面非常有用。

红黑树,是在JDK1.8之后在HashMap中数据结构的升级
一种树结构如 98(节点:存贮着key,value)
78 125
51 89 118 169

右边值大于中间值,中间值大于左边值,当条件查询查询key为125的值时，如果不加索引那么将进行6次磁盘I/O，如果添加索引将只要进行2次磁盘I/O.
查询流程: 直接从key为98的值根元素开始查询(1次磁盘I/O)，发现125大于98向右边查询找到125(2次磁盘I/O).
不足:但如果数据量太大树的高度还是很高

BTree(mysql)
与红黑树一样但是在其每个节点中存储着多个key，value，当查询某条数据时会将这个节点所有的key，value都读取到内存中RAM,在RAM在找出对应的key(RAM中处理的非常快,时间可以忽略不计)
78 118
51 89 98 125 169
78和118为一个节点，51为一个节点，89和98为一个节点，125和169为一个节点.

当查询169时只有2次磁盘I/O。

第一次磁盘I/O找到78个118，第二次磁盘I/O找到125和169这个节点，然后将这个节点读取到内存中处理。

B+Tree

B+Tree是BTree的改进版在节点与节点之间多了一个指针，只在树叶(树末梢)有value但这个value将不再是地址指针而是直接存放数据，上一个节点的key将遗留到下一个节点中，目的为了便于范围查询,如查询>98的记录。

没有这个指针，需要重新从根节点找,没有这个遗留的节点，因为一次磁盘I/O不能读取太多数据
78 118 (只有key)
51 ->78 89 98 ->118 125 169 (都有key,data)

存储引擎针对与表,一个数据库可以有两个不同存储引擎的表

MyISAM (BTree)

数据库文件下,data下的表文件夹中
frm文件：存储的是建表结构,即查看表对象中的内容,create… 主外键
MYD(MyISAM Data)文件：存储的是表中的数据
MYI(MyISAM Index)文件：存储的是表中的key和数据地址指针(即BTree)

当在数据库中查询时,如果发现有磁盘中有MYI文件(即添加了索引),会在索引中找到对应的节点,根据value的值(地址指针),去MYD文件中找到对应的地址。

InnoDB (B+Tree)
数据库文件下,data下的表文件夹中
frm文件:存储的是建表结构,即查看表对象中的内容,create… 主外键
idb文件(index data):存储的是key和数据(B+Tree)

非聚集索引，将索引与数据分开,即用MYI和MYD分开(MyISAM)
聚集索引，将索引与数据结合在一起,即使用idb文件把索引与数据结合(InnoDB)

mysql读取数据流程：cpu->RAM>磁盘
页/4K(4*1024B(字节)) 一次磁盘I/O只能读取正数页,一次性不能读取太多数据,所以一个节点不能存放太多数据
查看mysql文件页大小:show global status like ‘Innodb_page_size’ (官方默认16K)

6、散列表

散列表，也叫哈希表，是根据关键码和值 (key和value) 直接进行访问的数据结构，通过key和value来映射到集合中的一个位置，这样就可以很快找到集合中的对应元素。
记录的存储位置=f(key)

这里的对应关系 f 成为散列函数，又称为哈希 (hash函数)，而散列表就是把Key通过一个固定的算法函数既所谓的哈希函数转换成一个整型数字，然后就将该数字对数组长度进行取余，取余结果就当作数组的下标，将value存储在以该数字为下标的数组空间里，这种存储空间可以充分利用数组的查找优势来查找元素，所以查找的速度很快。

哈希表在应用中也是比较常见的，就如Java中有些集合类就是借鉴了哈希原理构造的，例如HashMap，HashTable等，利用hash表的优势，对于集合的查找元素时非常方便的。

然而，因为哈希表是基于数组衍生的数据结构，在添加删除元素方面是比较慢的，所以很多时候需要用到一种数组链表来做，也就是拉链法。

拉链法是数组结合链表的一种结构，较早前的hashMap底层的存储就是采用这种结构，直到jdk1.8之后才换成了数组加红黑树的结构。
其示例图如下：

从图中可以看出，左边很明显是个数组，数组的每个成员包括一个指针，指向一个链表的头，当然这个链表可能为空，也可能元素很多。

我们根据元素的一些特征把元素分配到不同的链表中去，也是根据这些特征，找到正确的链表，再从链表中找出这个元素。

哈希表的应用场景很多，当然也有很多问题要考虑，比如哈希冲突的问题，如果处理的不好会浪费大量的时间，导致应用崩溃。

7、堆

堆是一种比较特殊的数据结构，可以被看做一棵树的数组对象，具有以下的性质：
堆中某个节点的值总是不大于或不小于其父节点的值；
堆总是一棵完全二叉树。
将根节点最大的堆叫做最大堆或大根堆，根节点最小的堆叫做最小堆或小根堆。常见的堆有二叉堆、斐波那契堆等。

堆的定义如下：n个元素的序列{k1,k2,ki,…,kn}当且仅当满足下关系时，称之为堆。
(ki <= k2i,ki <= k2i+1)或者(ki >= k2i,ki >= k2i+1), (i = 1,2,3,4…n/2)，满足前者的表达式的成为小顶堆，满足后者表达式的为大顶堆，这两者的结构图可以用完全二叉树排列出来，
示例图如下：

因为堆有序的特点，一般用来做数组中的排序，称为堆排序。

8、图

图是由结点的有穷集合V和边的集合E组成。

其中，为了与树形结构加以区别，在图结构中常常将结点称为顶点，边是顶点的有序偶对，若两个顶点之间存在一条边，就表示这两个顶点具有相邻关系。
按照顶点指向的方向可分为无向图和有向图：

图是一种比较复杂的数据结构，在存储数据上有着比较复杂和高效的算法，分别有邻接矩阵、邻接表、十字链表、邻接多重表、边集数组等存储结构，这里不做展开，读者有兴趣可以自己学习深入。