Linux
简介
linux全称GNU/Linux,是一种免费使用和自由传播的类Unix操作系统,其内核由Linus Benedict Torvalds于1991年10月5日首次发布,Linux受到Minix和Unix思想的启发,是一个基于POSIX的多用户、 多任务 、支持多线程和多 CPU 的操作系统,能运行主要的Unix工具软件、应用程序和网络协议,支持32位和64位硬件, Linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统内核。
完整的操作系统不仅仅只有内核,还包括一系列为用户提供各种服务的程序。程序包括GNU程序库和工具,命令行Shell,图形界面的X Window系统和相应的桌面环境,如KDE或GNOME,并包含从办公套件,编译器,文本编辑器到科学工具的应用软件。所以,许多个人、组织和企业,开发了基于GNU/Linux的Linux发行版,他们将Linux系统的内核与应用软件以及文档包装起来,并提供一些系统安装界面和系统设置与管理工具,这样就构成了一个发行版本。
Linux内核有多个并行的发行版本,例如Ubuntu,RedHat,CentOS,Suse等,其中RedHat是商业公司维护的发行版本,可以收取咨询费用,其余的大多数都是社区维护的开源版本。
内核
从技术层面讲,内核是硬件与软件之间的一个中间层。内核不仅仅为上层应用层序提供了运行时环境,也屏蔽了应用层和底层硬件,提升了操作系统的稳定性。
- 抽象了底层硬件,屏蔽了应用程序和硬件的关联,对系统中的各种设备和组件进行寻址,简化了对硬件的调用。
- 作为资源管理程序,给应用进程分配各种共享资源,例如CPU时间、磁盘空间、网络连接等。
- 内核提供了丰富的功能,应用程序通过系统调用可以简化应用程序的复杂性。
Linux内核是模块化的设计理念,其主要组件包括系统调用接口、进程管理、内存管理、虚拟文件系统、网络堆栈、设备驱动程序、硬件架构等。
系统调用接口
操作系统的内核态进程和应用程序的用户态进程是相互隔离的,用户态进程如果需要访问内核的能力必须通过系统调用完成,系统调用给用户程序提供了一系列可见的,受约束的能力,通过这些能力程序可以访问内核的数据结构,可以调用硬件,同时,这些系统调用的API是固定的,受限的,可以有效的保护内核的稳定性。
SCI 层提供了某些机制执行从用户空间到内核的函数调用。正如前面讨论的一样,这个接口依赖于体系结构,甚至在相同的处理器家族内也是如此。SCI 实际上是一个非常有用的函数调用多路复用和多路分解服务。在 ./linux/kernel 中您可以找到 SCI 的实现,并在 ./linux/arch 中找到依赖于体系结构的部分。
进程管理
进程管理的重点是进程的执行。在内核中,这些进程称为线程,代表了单独的处理器虚拟化(线程代码、数据、堆栈和 CPU 寄存器)。在用户空间,通常使用进程 这个术语,不过 Linux 实现并没有区分这两个概念(进程和线程)。内核通过 SCI 提供了一个应用程序编程接口(API)来创建一个新进程(fork、exec 或 Portable Operating System Interface [POSIX] 函数),停止进程(kill、exit),并在它们之间进行通信和同步(signal 或者 POSIX 机制)。
进程管理还包括处理活动进程之间共享 CPU 的需求。内核实现了一种新型的调度算法,不管有多少个线程在竞争 CPU,这种算法都可以在固定时间内进行操作。这种算法就称为 O(1) 调度程序,这个名字就表示它调度多个线程所使用的时间和调度一个线程所使用的时间是相同的。O(1) 调度程序也可以支持多处理器(称为对称多处理器或 SMP)。您可以在 ./linux/kernel 中找到进程管理的源代码,在 ./linux/arch 中可以找到依赖于体系结构的源代码。
内存管理
内核所管理的另外一个重要资源是内存。为了提高效率,如果由硬件管理虚拟内存,内存是按照所谓的内存页 方式进行管理的(对于大部分体系结构来说都是 4KB)。Linux 包括了管理可用内存的方式,以及物理和虚拟映射所使用的硬件机制。不过内存管理要管理的可不止 4KB 缓冲区。Linux 提供了对 4KB 缓冲区的抽象,例如 slab 分配器。这种内存管理模式使用 4KB 缓冲区为基数,然后从中分配结构,并跟踪内存页使用情况,比如哪些内存页是满的,哪些页面没有完全使用,哪些页面为空。这样就允许该模式根据系统需要来动态调整内存使用。为了支持多个用户使用内存,有时会出现可用内存被消耗光的情况。由于这个原因,页面可以移出内存并放入磁盘中。这个过程称为交换,因为页面会被从内存交换到硬盘上。内存管理的源代码可以在 ./linux/mm 中找到。
虚拟文件系统
虚拟文件系统(VFS)是 Linux 内核中非常有用的一个方面,因为它为文件系统提供了一个通用的接口抽象。VFS 在 SCI 和内核所支持的文件系统之间提供了一个交换层。
在 VFS 上面,是对诸如 open、close、read 和 write 之类的函数的一个通用 API 抽象。在 VFS 下面是文件系统抽象,它定义了上层函数的实现方式。它们是给定文件系统(超过 50 个)的插件。文件系统的源代码可以在 ./linux/fs 中找到。文件系统层之下是缓冲区缓存,它为文件系统层提供了一个通用函数集(与具体文件系统无关)。这个缓存层通过将数据保留一段时间(或者随即预先读取数据以便在需要时就可用)优化了对物理设备的访问。缓冲区缓存之下是设备驱动程序,它实现了特定物理设备的接口。
网络堆栈
网络堆栈在设计上遵循模拟协议本身的分层体系结构。回想一下,Internet Protocol (IP) 是传输协议(通常称为传输控制协议或 TCP)下面的核心网络层协议。TCP 上面是 socket 层,它是通过 SCI 进行调用的。socket 层是网络子系统的标准 API,它为各种网络协议提供了一个用户接口。从原始帧访问到 IP 协议数据单元(PDU),再到 TCP 和 User Datagram Protocol (UDP),socket 层提供了一种标准化的方法来管理连接,并在各个终点之间移动数据。内核中网络源代码可以在 ./linux/net 中找到。
设备驱动程序
Linux 内核中有大量代码都在设备驱动程序中,它们能够运转特定的硬件设备。Linux 源码树提供了一个驱动程序子目录,这个目录又进一步划分为各种支持设备,例如 Bluetooth、I2C、serial 等。设备驱动程序的代码可以在 ./linux/drivers 中找到。
依赖体系结构的代码
尽管 Linux 很大程度上独立于所运行的体系结构,但是有些元素则必须考虑体系结构才能正常操作并实现更高效率。./linux/arch 子目录定义了内核源代码中依赖于体系结构的部分,其中包含了各种特定于体系结构的子目录(共同组成了 BSP)。对于一个典型的桌面系统来说,使用的是 x86 目录。每个体系结构子目录都包含了很多其他子目录,每个子目录都关注内核中的一个特定方面,例如引导、内核、内存管理等。这些依赖体系结构的代码可以在 ./linux/arch 中找到。
如果 Linux 内核的可移植性和效率还不够好,Linux 还提供了其他一些特性,它们无法划分到上面的分类中。作为一个生产操作系统和开源软件,Linux 是测试新协议及其增强的良好平台。Linux 支持大量网络协议,包括典型的 TCP/IP,以及高速网络的扩展(大于 1 Gigabit Ethernet [GbE] 和 10 GbE)。Linux 也可以支持诸如流控制传输协议(SCTP)之类的协议,它提供了很多比 TCP 更高级的特性(是传输层协议的接替者)。
Linux 还是一个动态内核,支持动态添加或删除软件组件。被称为动态可加载内核模块,它们可以在引导时根据需要(当前特定设备需要这个模块)或在任何时候由用户插入。
Linux 最新的一个增强是可以用作其他操作系统的操作系统(称为系统管理程序)。最近,对内核进行了修改,称为基于内核的虚拟机(KVM)。这个修改为用户空间启用了一个新的接口,它可以允许其他操作系统在启用了 KVM 的内核之上运行。除了运行 Linux 的其他实例之外, Microsoft Windows也可以进行虚拟化。惟一的限制是底层处理器必须支持新的虚拟化指令。
发行版
RedHat
RedHat通常是指红帽公司维护的商业版本RHEL。
红帽公司还并购了Fedora和CentOS,Fedora往往作为RHEL的先验版本在上面做一些实验性质的功能,因此稳定性较差,经常用于桌面应用。CentOS最早作为RHEL的社区克隆版本,有较高的稳定性。
近年红帽公司推出了CentOS Stream,和Fedora定位类似,也作为商业版的实验版本。同时已经停止了CentOS 7之外版本的维护,而CentOS 7也将于2024年6月30停止维护。
Redhat系列的包管理方式采用的是基于RPM包的YUM包管理方式,包分发方式是编译好的二进制文件。
Debian
Debian计划创建于 1993 年。Debian项目支持多种平台,目前包括英特尔和PowerPC,ARM,MIPS。
Debian的包管理方式适用Apt-get。
Ubuntu
Ubuntu是一个以桌面应用为主的Linux操作系统,其命名由来于非洲南部祖鲁语或豪萨语的"ubuntu"一词,意思类似于"人性",是非洲传统的一种价值观。
Ubuntu最早基于Debian发行版和Gnome桌面环境,而从11.04版起,Ubuntu发行版放弃了Gnome桌面环境,改为Unity。