architect-all

后端架构师技术图谱此为markdown文档安装

最后更新于2018-04-09 晚

数据结构
- 队列
- 集合
- 链表、数组
- 字典、关联数组
- 树
常用算法
- 排序、查找算法
- 贪心算法
- 回溯算法
- 剪枝算法
- 动态规划
- 朴素贝叶斯
- 推荐算法
并发
- 多线程
- 线程安全
- 一致性、事务
  - 事务 ACID 特性
  - 事务的隔离级别
- 锁
操作系统
- 计算机原理
- 进程
- 线程
- 协程
- Linux
设计模式
- 23种常见设计模式
- 责任链模式
- MVC
- IOC
- AOP
- UML
- 微服务思想
  - 康威定律
运维 & 统计 & 技术支持
- 常规监控
- APM
- 统计分析
- 持续集成
  - Jenkins
  - 环境分离
- 自动化运维
  - Ansible
  - puppet
  - chef
- 测试
- 虚拟化
  - KVM
  - Xen
  - OpenVZ
- 容器技术
  - Docker
- 云技术
  - OpenStack
- DevOps
- 文档管理
中间件
- Web Server
  - Nginx
  - OpenResty
  - Apache Httpd
  - Tomcat
  - Jetty
- 缓存
  - 本地缓存
- 客户端缓存
  - Memcached
  - Redis
  - Tair
- 消息队列
  - 消息总线
  - RabbitMQ
  - RocketMQ
  - ActiveMQ
  - Kafka
  - Redis 消息推送
  - ZeroMQ
- 定时调度
  - 单机定时调度
  - 分布式定时调度
- RPC
  - Dubbo
  - Thrift
  - gRPC
- 数据库中间件
  - Sharding Jdbc
- 日志系统
  - 日志搜集
- 配置中心
- API 网关
网络
- 协议
  - TCP/IP
  - HTTP
  - HTTP2.0
  - HTTPS
- 网络模型
  - Epoll
  - NIO
  - kqueue
- 框架
- 序列化(二进制协议)
  - Hessian
  - Protobuf
数据库
- MySQL
  - 原理
  - 优化
- NoSQL
  - MongoDB
  - Hbase
搜索引擎
- 搜索引擎原理
- Lucene
- Elasticsearch
- Solr
- sphinx
性能
- 性能优化方法论
- 容量评估
- CDN 网络
- 连接池
- 性能调优
大数据
- 流式计算
  - Storm
  - Flink
  - Kafka Stream
  - 应用场景
- Hadoop
  - HDFS
  - MapReduce
  - Yarn
- Spark
安全
- web 安全
  - XSS
  - CSRF
  - SQL 注入
  - 脚本注入
  - 漏洞扫描工具
  - 验证码
- DDoS 防范
- 加密解密
- 服务器安全
- 数据安全
  - 数据备份
- 网络隔离
  - 内外网分离
  - 登录跳板机
- 授权
  - RBAC
  - OAuth2.0
常用开源框架
- 开源协议
- 日志框架
  - Log4j、Log4j2
  - Logback
- ORM
- 网络框架
- Web 框架
- 工具框架
分布式设计
- 扩展性设计
- 稳定性 & 高可用
- 数据库扩展
  - 读写分离模式
  - 分片模式
- 服务治理
  - 服务注册与发现
  - 服务路由控制
- 分布式一致
- 分布式文件系统
- 唯一ID 生成
  - 全局唯一ID
- 一致性Hash算法
设计思想 & 开发模式
- DDD(Domain-driven Design - 领域驱动设计)
  - 命令查询职责分离(CQRS)
  - 贫血，充血模型
- Actor 模式
- 响应式编程
项目管理
- 架构评审
- 重构
- 代码规范
- RUP
- 看板管理
- SCRUM
- 极限编程
- 敏捷开发
- 结对编程
通用业务术语
技术趋势
架构师素质
团队管理
资讯
- 行业资讯
- 公众号列表
- 博客
  - 团队博客
  - 个人博客
- 综合门户、社区
- 问答、讨论类社区
- 专项网站
- 其他类
- 推荐参考书
  - 在线电子书
  - 纸质书
技术资源
- 开源资源
- 手册
- 在线课堂
- 会议
- 工具
- 文件服务
- 综合云服务商

数据结构

队列

《java队列——queue详细分析》
- 非阻塞队列：ConcurrentLinkedQueue(无界线程安全)，采用CAS机制。
- 阻塞队列：ArrayBlockingQueue、LinkedBlockingQueue、DelayQueue、PriorityBlockingQueue，采用锁机制。
《LinkedList、ConcurrentLinkedQueue、LinkedBlockingQueue对比分析》

集合

《Java Set集合的详解》

链表、数组

《Java集合详解--什么是List》

字典、关联数组

《Java map 详解 - 用法、遍历、排序、常用API等》

树

二叉树

每个节点最多有两个叶子节点。

《二叉树》

完全二叉树

《完全二叉树》
- 叶节点只能出现在最下层和次下层，并且最下面一层的结点都集中在该层最左边的若干位置的二叉树。

平衡二叉树

左右两个子树的高度差的绝对值不超过1，并且左右两个子树都是一棵平衡二叉树。

《浅谈数据结构-平衡二叉树》

红黑树

《最容易懂得红黑树》
- 添加阶段后，左旋或者右旋从而再次达到平衡。

B-，B+，B*树

MySQL是基于B+树聚集索引组织表

常用算法

《常见排序算法及对应的时间复杂度和空间复杂度》

排序、查找算法

《常见排序算法及对应的时间复杂度和空间复杂度》

选择排序

《Java中的经典算法之选择排序（SelectionSort）》
- 每一趟从待排序的记录中选出最小的元素，顺序放在已排好序的序列最后，直到全部记录排序完毕。

冒泡排序

《冒泡排序的2种写法》
- 相邻元素前后交换。
- 时间复杂度 O(n²)

插入排序

《排序算法总结之插入排序》

快速排序

《坐在马桶上看算法：快速排序》
- 一侧比另外一次都大或小。

归并排序

《图解排序算法(四)之归并排序》
- 分而治之，分成小份排序，在合并。

堆排序

《图解排序算法(三)之堆排序》
- 排序过程就是构建最大堆的过程，最大堆：每个结点的值都大于或等于其左右孩子结点的值。

计数排序

《计数排序和桶排序》
- 和桶排序过程比较像，差别在于桶的数量。

桶排序

《【啊哈！算法】最快最简单的排序——桶排序》
《排序算法（三）：计数排序与桶排序》
- 桶排序将[0,1)区间划分为n个相同的大小的子区间，这些子区间被称为桶。
- 每个通单独进行排序，然后再遍历每个桶。

基数排序

按照个位、十位、百位、...依次来排。

二分查找

《二分查找(java实现)》
- 要求待查找的序列有序。
- 时间复杂度 O(logN)。
《java实现二分查找-两种方式》
- while + 递归。

Java 中的排序工具

《Arrays.sort和Collections.sort实现原理解析》
- 归并排序。

贪心算法

回溯算法

《五大常用算法之四：回溯法》

剪枝算法

《α-β剪枝算法》

动态规划

朴素贝叶斯

并发

多线程

《40个Java多线程问题总结》

线程安全

《Java并发编程——线程安全及解决机制简介》

一致性、事务

事务 ACID 特性

《数据库事务ACID特性》

事务的隔离级别

未提交读：一个事务可以读取另一个未提交的数据，容易出现脏读的情况。
读提交：一个事务等另外一个事务提交之后才可以读取数据，但会出现不可重复读的情况（多次读取的数据不一致），读取过程中出现UPDATE操作，会多。（大多数数据库默认级别是RC，比如SQL Server，Oracle），读取的时候不可以修改。
可重复读：读取的时候就锁定，不可修改（会影响更新），Mysql InnoDB 就是这个级别。
序列化：所有事物串行处理（牺牲了效率）
《理解事务的4种隔离级别》
数据库事务的四大特性及事务隔离级别

锁

Java中的锁和同步类

《Java中的锁分类》
- 主要包括 synchronized、ReentrantLock、和 ReadWriteLock。
《Java并发之AQS详解》
《Java中信号量 Semaphore》
- 有数量控制
- 申请用 acquire，申请不要则阻塞；释放用 release。
《java开发中的Mutex vs Semaphore》
- 简单的说就是Mutex是排它的，只有一个可以获取到资源， Semaphore也具有排它性，但可以定义多个可以获取的资源的对象。

公平锁 & 非公平锁

公平锁的作用就是严格按照线程启动的顺序来执行的，不允许其他线程插队执行的；而非公平锁是允许插队的。

《公平锁与非公平锁》
- 默认情况下 ReentrantLock 和 synchronized 都是非公平锁。ReentrantLock 可以设置成公平锁。

悲观锁 & 乐观锁 & CAS

《【MySQL】悲观锁&乐观锁》
- 乐观锁的方式：版本号+重试方式
- 悲观锁：通过 select ... for update 进行行锁。
《乐观锁的一种实现方式——CAS》
- 和MySQL乐观锁方式相似，只不过是通过和原值进行比较。

ABA 问题

由于高并发，在CAS下，更新后可能此A非彼A。通过版本号可以解决，类似于上文Mysql 中提到的的乐观锁。

《Java CAS 和ABA问题》
《Java 中 ABA问题及避免》
- AtomicStampedReference 和 AtomicStampedReference。

CopyOnWrite容器

可以对CopyOnWrite容器进行并发的读，而不需要加锁。CopyOnWrite并发容器用于读多写少的并发场景。比如白名单，黑名单，商品类目的访问和更新场景，不适合需要数据强一致性的场景。

RingBuffer

《线程安全的无锁RingBuffer的实现【一个读线程，一个写线程】》

可重入锁 & 不可重入锁

《可重入锁和不可重入锁》
- 通过简单代码举例说明可重入锁和不可重入锁。
- 可重入锁指同一个线程可以再次获得之前已经获得的锁。
- 可重入锁可以用户避免死锁。
- Java中的可重入锁：synchronized 和 java.util.concurrent.locks.ReentrantLock
《ReenTrantLock可重入锁（和synchronized的区别）总结》
- synchronized 使用方便，编译器来加锁，是非公平锁。
- ReenTrantLock 使用灵活，锁的公平性可以定制。
- 相同加锁场景下，推荐使用 synchronized。

操作系统

计算机原理

《操作系统基础知识——操作系统的原理，类型和结构》

进程

TODO

线程

TODO

协程

TODO

Linux

《Linux 命令大全》

设计模式

23种常见设计模式

责任链模式

MVC

《MVC 模式》
- 模型(model)－视图(view)－控制器(controller)

IOC

《理解 IOC》
《IOC 的理解与解释》
- 正向控制：传统通过new的方式。反向控制，通过容器注入对象。
- 作用：用于模块解耦。
- DI：Dependency Injection，即依赖注入，只关心资源使用，不关心资源来源。

AOP

《轻松理解AOP(面向切面编程)》
《Spring AOP详解》
《Spring AOP的实现原理》
- Spring AOP使用的动态代理，主要有两种方式：JDK动态代理和CGLIB动态代理。
《Spring AOP 实现原理与 CGLIB 应用》
- Spring AOP 框架对 AOP 代理类的处理原则是：如果目标对象的实现类实现了接口，Spring AOP 将会采用 JDK 动态代理来生成 AOP 代理类；如果目标对象的实现类没有实现接口，Spring AOP 将会采用 CGLIB 来生成 AOP 代理类

UML

《UML教程》

微服务思想

《微服务架构设计》

康威定律

《微服务架构的理论基础 - 康威定律》
- 定律一：组织沟通方式会通过系统设计表达出来，就是说架构的布局和组织结构会有相似。
- 定律二：时间再多一件事情也不可能做的完美，但总有时间做完一件事情。一口气吃不成胖子，先搞定能搞定的。
- 定律三：线型系统和线型组织架构间有潜在的异质同态特性。种瓜得瓜，做独立自治的字系统减少沟通成本。
- 定律四：大的系统组织总是比小系统更倾向于分解。合久必分，分而治之。

运维 & 统计 & 技术支持

常规监控

《腾讯业务系统监控的修炼之路》
- 监控的方式：主动、被动、旁路(比如舆情监控)
- 监控类型：基础监控、服务端监控、客户端监控、监控、用户端监控
- 监控的目标：全、块、准
- 核心指标：请求量、成功率、耗时
《开源还是商用？十大云运维监控工具横评》
- Zabbix、Nagios、Ganglia、Zenoss、Open-falcon、监控宝、 360网站服务监控、阿里云监控、百度云观测、小蜜蜂网站监测等。
《监控报警系统搭建及二次开发经验》

命令行监控工具

APM

APM — Application Performance Management

《Dapper，大规模分布式系统的跟踪系统》
《开源APM技术选型与实战》
- 主要基于 Google的Dapper（大规模分布式系统的跟踪系统）思想。
- 开源软件有：Pinpoint、SkyWalking、Zipkin、CAT

统计分析

《流量统计的基础：埋点》
- 常用指标：访问与访客、停留时长、跳出率、退出率、转化率、参与度
《APP埋点常用的统计工具、埋点目标和埋点内容》
- 第三方统计：友盟、百度移动、魔方、App Annie、talking data、神策数据等。
《美团点评前端无痕埋点实践》
- 所谓无痕、即通过可视化工具配置采集节点，在前端自动解析配置并上报埋点数据，而非硬编码。

持续集成

Jenkins

《使用Jenkins进行持续集成》

环境分离

开发、测试、生成环境分离。

《开发环境、生产环境、测试环境的基本理解和区》

自动化运维

Ansible

puppet

《自动化运维工具——puppet详解》

chef

《Chef 的安装与使用》

测试

TDD 理论

《深度解读 - TDD（测试驱动开发）》
- 基于测试用例编码功能代码，XP（Extreme Programming）的核心实践.
- 好处：一次关注一个点，降低思维负担；迎接需求变化或改善代码的设计；提前澄清需求；快速反馈；

单元测试

《Java单元测试之JUnit篇》
《JUnit 4 与 TestNG 对比》
- TestNG 覆盖 JUnit 功能，适用于更复杂的场景。
《单元测试主要的测试功能点》
- 模块接口测试、局部数据结构测试、路径测试、错误处理测试、边界条件测试。

压力测试

全链路压测

A/B Test

虚拟化

《VPS的三种虚拟技术OpenVZ、Xen、KVM优缺点比较》

KVM

Xen

《Xen虚拟化基本原理详解》

OpenVZ

《开源Linux容器 OpenVZ 快速上手指南》

容器技术

Docker

云技术

OpenStack

《OpenStack构架知识梳理》

DevOps

文档管理

中间件

Web Server

Nginx

《Ngnix的基本学习-多进程和Apache的比较》
- Nginx 通过异步非阻塞的事件处理机制实现高并发。Apache 每个请求独占一个线程，非常消耗系统资源。
- 事件驱动适合于IO密集型服务(Nginx)，多进程或线程适合于CPU密集型服务(Apache)，所以Nginx适合做反向代理，而非web服务器使用。
《nginx与Apache的对比以及优缺点》
- nginx只适合静态和反向代理，不适合处理动态请求。

OpenResty

官方网站
《浅谈 OpenResty》
- 通过 Lua 模块可以在Nginx上进行开发。

Apache Httpd

官方网站

Tomcat

《TOMCAT原理详解及请求过程》
《Tomcat服务器原理详解》
《Tomcat 系统架构与设计模式,第 1 部分: 工作原理》
《JBoss vs. Tomcat: Choosing A Java Application Server》
- Tomcat 是轻量级的 Serverlet 容器，没有实现全部 JEE 特性（比如持久化和事务处理），但可以通过其他组件代替，比如Srping。
- Jboss 实现全部了JEE特性，软件开源免费、文档收费。
《Tomcat 调优方案》
- 启动NIO模式（或者APR）；调整线程池；禁用AJP连接器（Nginx+tomcat的架构，不需要AJP）；
《tomcat http协议与ajp协议》
《AJP与HTTP比较和分析》
- AJP 协议（8009端口）用于降低和前端Server（如Apache，而且需要支持AJP协议）的连接数(前端)，通过长连接提高性能。
- 并发高时，AJP协议优于HTTP协议。

Jetty

《Jetty 的工作原理以及与 Tomcat 的比较》
《jetty和tomcat优势比较》
- 架构比较:Jetty的架构比Tomcat的更为简单。
- 性能比较：Jetty和Tomcat性能方面差异不大，Jetty默认采用NIO结束在处理I/O请求上更占优势，Tomcat默认采用BIO处理I/O请求，Tomcat适合处理少数非常繁忙的链接，处理静态资源时性能较差。
- 其他方面：Jetty的应用更加快速，修改简单，对新的Servlet规范的支持较好;Tomcat 对JEE和Servlet 支持更加全面。

缓存

《缓存失效策略（FIFO 、LRU、LFU三种算法的区别）》

本地缓存

《HashMap本地缓存》
《EhCache本地缓存》
- 堆内、堆外、磁盘三级缓存。
- 可按照缓存空间容量进行设置。
- 按照时间、次数等过期策略。
《Guava Cache》
- 简单轻量、无堆外、磁盘缓存。
《Guava Cache》
- 简单轻量、无堆外、磁盘缓存。
《Nginx本地缓存》
《Pagespeed—懒人工具，服务器端加速》

客户端缓存

《浏览器端缓存》
- 主要是利用 Cache-Control 参数。
《H5 和移动端 WebView 缓存机制解析与实战》

Memcached

《Memcached 教程》
《深入理解Memcached原理》
- 采用多路复用技术提高并发性。
- slab分配算法： memcached给Slab分配内存空间，默认是1MB。分配给Slab之后把slab的切分成大小相同的chunk，Chunk是用于缓存记录的内存空间，Chunk 的大小默认按照1.25倍的速度递增。好处是不会频繁申请内存，提高IO效率，坏处是会有一定的内存浪费。
《Memcached软件工作原理》
《Memcache技术分享：介绍、使用、存储、算法、优化、命中率》
《memcached全面剖析》

Redis

《Redis 教程》
《redis底层原理》
- 使用 ziplist 存储链表，ziplist是一种压缩链表，它的好处是更能节省内存空间，因为它所存储的内容都是在连续的内存区域当中的。
- 使用 skiplist(跳跃表)来存储有序集合对象、查找上先从高Level查起、时间复杂度和红黑树相当，实现容易，无锁、并发性好。
《Redis持久化方式》
- RDB方式：定期备份快照，常用于灾难恢复。优点：通过fork出的进程进行备份，不影响主进程、RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。缺点：会丢数据。
- AOF方式：保存操作日志方式。优点：恢复时数据丢失少，缺点：文件大，回复慢。
- 也可以两者结合使用。

Tair

官方网站
《Tair和Redis的对比》
特点：可以配置备份节点数目，通过异步同步到备份节点
一致性Hash算法。
架构：和Hadoop 的设计思想类似，有Configserver，DataServer，Configserver 通过心跳来检测，Configserver也有主备关系。

几种存储引擎:

MDB，完全内存性，可以用来存储Session等数据。
Rdb（类似于Redis），轻量化，去除了aof之类的操作，支持Restfull操作
LDB（LevelDB存储引擎），持久化存储，LDB 作为rdb的持久化，google实现，比较高效，理论基础是LSM(Log-Structured-Merge Tree)算法，现在内存中修改数据，达到一定量时（和内存汇总的旧数据一同写入磁盘）再写入磁盘，存储更加高效，县比喻Hash算法。
Tair采用共享内存来存储数据，如果服务挂掉（非服务器），重启服务之后，数据亦然还在。

消息队列

《消息队列-推/拉模式学习 & ActiveMQ及JMS学习》
- RabbitMQ 消费者默认是推模式（也支持拉模式）。
- Kafka 默认是拉模式。
- Push方式：优点是可以尽可能快地将消息发送给消费者，缺点是如果消费者处理能力跟不上，消费者的缓冲区可能会溢出。
- Pull方式：优点是消费端可以按处理能力进行拉去，缺点是会增加消息延迟。
《Kafka、RabbitMQ、RocketMQ等消息中间件的对比 —— 消息发送性能和区别》

消息总线

消息总线相当于在消息队列之上做了一层封装，统一入口，统一管控、简化接入成本。

《消息总线VS消息队列》

RabbitMQ

支持事务，推拉模式都是支持、适合需要可靠性消息传输的场景。

RocketMQ

Java实现，推拉模式都是支持，吞吐量逊于Kafka。可以保证消息顺序。

《RocketMQ 实战之快速入门》

ActiveMQ

纯Java实现，兼容JMS，可以内嵌于Java应用中。

《ActiveMQ消息队列介绍》

Kafka

高吞吐量、采用拉模式。适合搞IO场景，比如日志同步。

Redis 消息推送

生产者、消费者模式完全是客户端行为，list 和拉模式实现，阻塞等待采用 blpop 指令。

《Redis学习笔记之十：Redis用作消息队列》

ZeroMQ

TODO

定时调度

单机定时调度

《linux定时任务cron配置》
《Linux cron运行原理》
- fork 进程 + sleep 轮询
《Quartz使用总结》
《Quartz源码解析 ---- 触发器按时启动原理》
《quartz原理揭秘和源码解读》
- 定时调度在 QuartzSchedulerThread 代码中，while()无限循环，每次循环取出时间将到的trigger，触发对应的job，直到调度器线程被关闭。

分布式定时调度

《这些优秀的国产分布式任务调度系统，你用过几个？》
- opencron、LTS、XXL-JOB、Elastic-Job、Uncode-Schedule、Antares
《Quartz任务调度的基本实现原理》
- Quartz集群中，独立的Quartz节点并不与另一其的节点或是管理节点通信，而是通过相同的数据库表来感知到另一Quartz应用的

RPC

《从零开始实现RPC框架 - RPC原理及实现》
- 核心角色：Server: 暴露服务的服务提供方、Client: 调用远程服务的服务消费方、Registry: 服务注册与发现的注册中心。
《分布式RPC框架性能大比拼 dubbo、motan、rpcx、gRPC、thrift的性能比较》

Dubbo

Thrift

官方网站
《Thrift RPC详解》
- 支持多语言，通过中间语言定义接口。

gRPC

服务端可以认证加密，在外网环境下，可以保证数据安全。

数据库中间件

Sharding Jdbc

官网

日志系统

日志搜集

配置中心

Apollo - 携程开源的配置中心应用
- Spring Boot 和 Spring Cloud
- 支持推、拉模式更新配置
- 支持多种语言
《基于zookeeper实现统一配置管理》
《 Spring Cloud Config 分布式配置中心使用教程》

servlet 3.0 异步特性可用于配置中心的客户端

《servlet3.0 新特性——异步处理》

API 网关

主要职责：请求转发、安全认证、协议转换、容灾。

网络

协议

HTTPS

网络模型

《web优化必须了解的原理之I/o的五种模型和web的三种工作模式》
- 五种I/O模型：阻塞I/O，非阻塞I/O，I/O复用、事件(信号)驱动I/O、异步I/O，前四种I/O属于同步操作，I/O的第一阶段不同、第二阶段相同，最后的一种则属于异步操作。
- 三种 Web Server 工作方式：Prefork(多进程)、Worker方式(线程方式)、Event方式。
《select、poll、epoll之间的区别总结》
- select，poll，epoll本质上都是同步I/O，因为他们都需要在读写事件就绪后自己负责进行读写，也就是说这个读写过程是阻塞的。
- select 有打开文件描述符数量限制，默认1024（2048 for x64），100万并发，就要用1000个进程、切换开销大；poll采用链表结构，没有数量限制。
- select，poll “醒着”的时候要遍历整个fd集合，而epoll在“醒着”的时候只要判断一下就绪链表是否为空就行了，通过回调机制节省大量CPU时间；select，poll每次调用都要把fd集合从用户态往内核态拷贝一次，而epoll只要一次拷贝。
- poll会随着并发增加，性能逐渐下降，epoll采用红黑树结构，性能稳定，不会随着连接数增加而降低。
《select，poll，epoll比较》
- 在连接数少并且连接都十分活跃的情况下，select和poll的性能可能比epoll好，毕竟epoll的通知机制需要很多函数回调。
《深入理解Java NIO》
- NIO 是一种同步非阻塞的 IO 模型。同步是指线程不断轮询 IO 事件是否就绪，非阻塞是指线程在等待 IO 的时候，可以同时做其他任务
《BIO与NIO、AIO的区别》
《两种高效的服务器设计模型：Reactor和Proactor模型》

Epoll

《epoll使用详解（精髓）》

NIO

《深入理解Java NIO》

kqueue

《kqueue用法简介》

框架

《Netty原理剖析》
- Reactor 模式介绍。
- Netty 是 Reactor 模式的一种实现。

序列化(二进制协议)

Hessian

《Hessian原理分析》 Binary-RPC;不仅仅是序列化

Protobuf

《Protobuf协议的Java应用例子》 Goolge出品、占用空间和效率完胜其他序列化类库，如Hessian；需要编写 .proto 文件。
《Protocol Buffers序列化协议及应用》关于协议的解释；缺点：可读性差;

#数据库

MySQL

原理

[《MySQL的InnoDB索引原理详解》] (http://www.admin10000.com/document/5372.html)
《MySQL存储引擎－－MyISAM与InnoDB区别》
- 两种类型最主要的差别就是Innodb 支持事务处理与外键和行级锁
《myisam和innodb索引实现的不同》

优化

《MYSQL性能优化的最佳20+条经验》

NoSQL

MongoDB

MongoDB 教程
《Mongodb相对于关系型数据库的优缺点》
- 优点：弱一致性（最终一致），更能保证用户的访问速度；内置GridFS，支持大容量的存储；Schema-less 数据库，不用预先定义结构；内置Sharding；相比于其他NoSQL，第三方支持丰富；性能优越；
- 缺点：mongodb不支持事务操作；mongodb占用空间过大；MongoDB没有如MySQL那样成熟的维护工具，这对于开发和IT运营都是个值得注意的地方；

Hbase

搜索引擎

搜索引擎原理

《倒排索引--搜索引擎入门》

Lucene

《Lucene入门简介》

Elasticsearch

Solr

sphinx

《Sphinx 的介绍和原理探索》

性能

性能优化方法论

《15天的性能优化工作，5方面的调优经验》
- 代码层面、业务层面、数据库层面、服务器层面、前端优化。
《系统性能优化的几个方面》

容量评估

《联网性能与容量评估的方法论和典型案例》

CDN 网络

连接池

《主流Java数据库连接池比较与开发配置实战》

性能调优

《九大Java性能调试工具，必备至少一款》

#大数据

流式计算

Storm

Flink

《Flink之一 Flink基本原理介绍》

Kafka Stream

《Kafka Stream调研：一种轻量级流计算模式》

应用场景

例如：

广告相关实时统计；
推荐系统用户画像标签实时更新；
线上服务健康状况实时监测；
实时榜单；
实时数据统计。

Hadoop

HDFS

《【Hadoop学习】HDFS基本原理》

MapReduce

Yarn

《初步掌握Yarn的架构及原理》

Spark

《Spark(一): 基本架构及原理》

安全

web 安全

XSS

《xss攻击原理与解决方法》

CSRF

《CSRF原理及防范》

SQL 注入

《SQL注入》

脚本注入

《上传文件漏洞原理及防范》

漏洞扫描工具

验证码

《验证码原理分析及实现》
《详解滑动验证码的实现原理》
- 滑动验证码是根据人在滑动滑块的响应时间，拖拽速度，时间，位置，轨迹，重试次数等来评估风险。
《淘宝滑动验证码研究》

DDoS 防范

加密解密

对称加密

《常见对称加密算法》
- DES、3DES、Blowfish、AES
- DES 采用 56位秘钥，Blowfish 采用1到448位变长秘钥，AES 128，192和256位长度的秘钥。
- DES 秘钥太短（只有56位）算法目前已经被 AES 取代，并且 AES 有硬件加速，性能很好。

哈希算法

《常用的哈希算法》
- MD5 和 SHA-1 已经不再安全，已被弃用。
- 目前 SHA-256 是比较安全的。
《基于Hash摘要签名的公网URL签名验证设计方案》

非对称加密

《常见非对称加密算法》
- RSA、DSA、ECDSA(螺旋曲线加密算法)
- 和 RSA 不同的是 DSA 仅能用于数字签名，不能进行数据加密解密，其安全性和RSA相当，但其性能要比RSA快。
- 256位的ECC秘钥的安全性等同于3072位的RSA秘钥。
  
  《区块链的加密技术》

服务器安全

《Linux强化论：15步打造一个安全的Linux服务器》

数据安全

数据备份

TODO

网络隔离

内外网分离

TODO

登录跳板机

在内外环境中通过跳板机登录到线上主机。

《搭建简易堡垒机》

授权

RBAC

OAuth2.0

《理解OAuth 2.0》

常用开源框架

开源协议

《开原协议的选择》

日志框架

Log4j、Log4j2

《log4j 详细讲解》
《log4j2 实际使用详解》
《Log4j1,Logback以及Log4j2性能测试对比》
- Log4J 异步日志性能优异。

Logback

《最全LogBack 详解、含java案例和配置说明》

ORM

《ORM框架使用优缺点》
- 主要目的是为了提高开发效率。

MyBatis：

《mybatis缓存机制详解》
- 一级缓存是SqlSession级别的缓存，缓存的数据只在SqlSession内有效
- 二级缓存是mapper级别的缓存，同一个namespace公用这一个缓存，所以对SqlSession是共享的；使用 LRU 机制清理缓存，通过 cacheEnabled 参数开启。
《MyBatis学习之代码生成器Generator》

网络框架

TODO

Web 框架

Spring 家族

** Spring Boot **

** Spring Cloud **

Spring Cloud 中文文档

工具框架

分布式设计

扩展性设计

《架构师不可不知的十大可扩展架构》
- 总结下来，通用的套路就是分布、缓存及异步处理。
《可扩展性设计之数据切分》
- 水平切分+垂直切分
- 利用中间件进行分片如，MySQL Proxy。
- 利用分片策略进行切分，如按照ID取模。
《说说如何实现可扩展性的大型网站架构》
- 分布式服务+消息队列。
《大型网站技术架构（七）--网站的可扩展性架构》

稳定性 & 高可用

《系统设计：关于高可用系统的一些技术方案》
- 可扩展：水平扩展、垂直扩展。通过冗余部署，避免单点故障。
- 隔离：避免单一业务占用全部资源。避免业务之间的相互影响 2. 机房隔离避免单点故障。
- 解耦：降低维护成本，降低耦合风险。减少依赖，减少相互间的影响。
- 限流：滑动窗口计数法、漏桶算法、令牌桶算法等算法。遇到突发流量时，保证系统稳定。
- 降级：紧急情况下释放非核心功能的资源。牺牲非核心业务，保证核心业务的高可用。
- 熔断：异常情况超出阈值进入熔断状态，快速失败。减少不稳定的外部依赖对核心服务的影响。
- 自动化测试：通过完善的测试，减少发布引起的故障。
- 灰度发布：灰度发布是速度与安全性作为妥协，能够有效减少发布故障。
《关于高可用的系统》
- 设计原则：数据不丢(持久化)；服务高可用(服务副本)；绝对的100%高可用很难，目标是做到尽可能多的9，如99.999%（全年累计只有5分钟）。

硬件负载均衡

《转！！负载均衡器技术Nginx和F5的优缺点对比》
- 主要是和F5对比。
《软/硬件负载均衡产品你知多少？》

软件负载均衡

《几种负载均衡算法》轮寻、权重、负载、最少连接、QoS
《DNS负载均衡》
- 配置简单，更新速度慢。
《Nginx负载均衡》
- 简单轻量、学习成本低；主要适用于web应用。
《借助LVS+Keepalived实现负载均衡》
- 配置比较负载、只支持到4层，性能较高。
《HAProxy用法详解全网最详细中文文档》
- 支持到七层（比如HTTP）、功能比较全面，性能也不错。
《Haproxy+Keepalived+MySQL实现读均衡负载》
- 主要是用户读请求的负载均衡。
《rabbitmq+haproxy+keepalived实现高可用集群搭建》

限流

《谈谈高并发系统的限流》
- 计数器：通过滑动窗口计数器，控制单位时间内的请求次数，简单粗暴。
- 漏桶算法：固定容量的漏桶，漏桶满了就丢弃请求，比较常用。
- 令牌桶算法：固定容量的令牌桶，按照一定速率添加令牌，处理请求前需要拿到令牌，拿不到令牌则丢弃请求，或进入丢队列，可以通过控制添加令牌的速率，来控制整体速度。Guava 中的 RateLimiter 是令牌桶的实现。
- Nginx 限流：通过 limit_req 等模块限制并发连接数。

应用层容灾

《防雪崩利器：熔断器 Hystrix 的原理与使用》
- 雪崩效应原因：硬件故障、硬件故障、程序Bug、重试加大流量、用户大量请求。
- 雪崩的对策：限流、改进缓存模式(缓存预加载、同步调用改异步)、自动扩容、降级。
- Hystrix设计原则：
  - 资源隔离：Hystrix通过将每个依赖服务分配独立的线程池进行资源隔离, 从而避免服务雪崩。
  - 熔断开关：服务的健康状况 = 请求失败数 / 请求总数，通过阈值设定和滑动窗口控制开关。
  - 命令模式：通过继承 HystrixCommand 来包装服务调用逻辑。
《缓存穿透，缓存击穿，缓存雪崩解决方案分析》
《缓存击穿、失效以及热点key问题》
- 主要策略：失效瞬间：单机使用锁；使用分布式锁；不过期；
- 热点数据：热点数据单独存储；使用本地缓存；分成多个子key；

###跨机房容灾

《“异地多活”多机房部署经验谈》
- 通过自研中间件进行数据同步。
《异地多活（异地双活）实践经验》
- 注意延迟问题，多次跨机房调用会将延时放大数倍。
- 建房间专线很大概率会出现问题，做好运维和程序层面的容错。
- 不能依赖于程序端数据双写，要有自动同步方案。
- 数据永不在高延迟和较差网络质量下，考虑同步质量问题。
- 核心业务和次要业务分而治之，甚至只考虑核心业务。
- 异地多活监控部署、测试也要跟上。
- 业务允许的情况下考虑用户分区，尤其是游戏、邮箱业务。
- 控制跨机房消息体大小，越小越好。
- 考虑使用docker容器虚拟化技术，提高动态调度能力。
容灾技术及建设经验介绍

容灾演练流程

《依赖治理、灰度发布、故障演练，阿里电商故障演练系统的设计与实战经验》
- 常见故障画像
- 案例：预案有效性、预案有效性、故障复现、架构容灾测试、参数调优、参数调优、故障突袭、联合演练。

平滑启动

平滑重启应用思路 1.端流量（如vip层）、2. flush 数据(如果有)、3, 重启应用
《JVM安全退出（如何优雅的关闭java服务）》推荐推出方式：System.exit，Kill SIGTERM；不推荐 kill-9；用 Runtime.addShutdownHook 注册钩子。
《常见Java应用如何优雅关闭》 Java、Srping、Dubbo 优雅关闭方式。

数据库扩展

读写分离模式

《Mysql主从方案的实现》
《搭建MySQL主从复制经典架构》
《Haproxy+多台MySQL从服务器(Slave) 实现负载均衡》
《DRBD+Heartbeat+Mysql高可用读写分离架构》
- DRDB 进行磁盘复制，避免单点问题。
《MySQL Cluster 方式》

分片模式

《分库分表需要考虑的问题及方案》
- 中间件：轻量级：sharding-jdbc、TSharding；重量级：Atlas、MyCAT、Vitess等。
- 问题：事务、Join、迁移、扩容、ID、分页等。
- 事务补偿：对数据进行对帐检查;基于日志进行比对;定期同标准数据来源进行同步等。
- 分库策略：数值范围；取模；日期等。
- 分库数量：通常 MySQL 单库 5千万条、Oracle 单库一亿条需要分库。
《MySql分表和表分区详解》
- 分区：是MySQL内部机制，对客户端透明，数据存储在不同文件中，表面上看是同一个表。
- 分表：物理上创建不同的表、客户端需要管理分表路由。

服务治理

服务注册与发现

《永不失联！如何实现微服务架构中的服务发现？》
- 客户端服务发现模式：客户端直接查询注册表，同时自己负责负载均衡。Eureka 采用这种方式。
- 服务器端服务发现模式：客户端通过负载均衡查询服务实例。
《SpringCloud服务注册中心比较:Consul vs Zookeeper vs Etcd vs Eureka》
- CAP支持：Consul（CA）、zookeeper（cp）、etcd（cp）、euerka（ap）
- 作者认为目前 Consul 对 Spring cloud 的支持比较好。
《基于Zookeeper的服务注册与发现》
- 优点：API简单、Pinterest，Airbnb 在用、多语言、通过watcher机制来实现配置PUSH，能快速响应配置变化。

服务路由控制

《分布式服务框架学习笔记4 服务路由》
- 原则：透明化路由
- 负载均衡策略：随机、轮询、服务调用延迟、一致性哈希、粘滞连接
- 本地路由有限策略：injvm(优先调用jvm内部的服务)，innative(优先使用相同物理机的服务),原则上找距离最近的服务。
- 配置方式：统一注册表；本地配置；动态下发。

分布式一致

CAP 与 BASE 理论

《从分布式一致性谈到CAP理论、BASE理论》
- 一致性分类：强一致(立即一致)；弱一致(可在单位时间内实现一致，比如秒级)；最终一致(弱一致的一种，一定时间内最终一致)
- CAP：一致性、可用性、分区容错性(网络故障引起)
- BASE：Basically Available（基本可用）、Soft state（软状态）和Eventually consistent（最终一致性）
- BASE理论的核心思想是：即使无法做到强一致性，但每个应用都可以根据自身业务特点，采用适当的方式来使系统达到最终一致性。

分布式锁

《分布式锁的几种实现方式》
- 基于数据库的分布式锁：优点：操作简单、容易理解。缺点：存在单点问题、数据库性能够开销较大、不可重入；
- 基于缓存的分布式锁：优点：非阻塞、性能好。缺点：操作不好容易造成锁无法释放的情况。
- Zookeeper 分布式锁：通过有序临时节点实现锁机制，自己对应的节点需要最小，则被认为是获得了锁。优点：集群可以透明解决单点问题，避免锁不被释放问题，同时锁可以重入。缺点：性能不如缓存方式，吞吐量会随着zk集群规模变大而下降。
《基于Zookeeper的分布式锁》
- 清楚的原理描述 + Java 代码示例。

分布式一致性算法

####PAXOS

Zab

《Zab：Zookeeper 中的分布式一致性协议介绍》

Raft

《Raft 为什么是更易理解的分布式一致性算法》

Gossip

《Gossip算法》

两阶段提交、多阶段提交

《关于分布式事务、两阶段提交协议、三阶提交协议》

幂等

《分布式系统---幂等性设计》
- 幂等特性的作用：该资源具备幂等性，请求方无需担心重复调用会产生错误。
- 常见保证幂等的手段：MVCC（类似于乐观锁）、去重表(唯一索引)、悲观锁、一次性token、序列号方式。

分布式一致方案

分布式 Leader 节点选举

《利用zookeeper实现分布式leader节点选举》

TCC(Try/Confirm/Cancel) 柔性事务

《传统事务与柔性事务》
- 基于BASE理论：基本可用、柔性状态、最终一致。
- 解决方案：记录日志+补偿（正向补充或者回滚）、消息重试(要求程序要幂等)；“无锁设计”、采用乐观锁机制。

分布式文件系统

说说分布式文件存储系统-基本架构？
《各种分布式文件系统的比较》？
- HDFS：大批量数据读写，用于高吞吐量的场景，不适合小文件。
- FastDFS：轻量级、适合小文件。

唯一ID 生成

全局唯一ID

《高并发分布式系统中生成全局唯一Id汇总》
- Twitter 方案（Snowflake 算法）：41位时间戳+10位机器标识（比如IP，服务器名称等）+12位序列号(本地计数器)
- Flicker 方案：MySQL自增ID + "REPLACE INTO XXX:SELECT LAST_INSERT_ID();"
- UUID：缺点，无序，字符串过长，占用空间，影响检索性能。
- MongoDB 方案：利用 ObjectId。缺点：不能自增。
《TDDL 在分布式下的SEQUENCE原理》
- 在数据库中创建 sequence 表，用于记录，当前已被占用的id最大值。
- 每台客户端主机取一个id区间（比如 1000~2000）缓存在本地，并更新 sequence 表中的id最大值记录。
- 客户端主机之间取不同的id区间，用完再取，使用乐观锁机制控制并发。

一致性Hash算法

《一致性哈希算法》

设计思想 & 开发模式

DDD(Domain-driven Design - 领域驱动设计)

《浅谈我对DDD领域驱动设计的理解》
- 概念：DDD 主要对传统软件开发流程(分析-设计-编码)中各阶段的割裂问题而提出，避免由于一开始分析不明或在软件开发过程中的信息流转不一致而造成软件无法交付（和需求方设想不一致）的问题。DDD 强调一切以领域（Domain）为中心，强调领域专家（Domain Expert）的作用，强调先定义好领域模型之后在进行开发，并且领域模型可以指导开发（所谓的驱动）。
- 过程：理解领域、拆分领域、细化领域，模型的准确性取决于模型的理解深度。
- 设计：DDD 中提出了建模工具，比如聚合、实体、值对象、工厂、仓储、领域服务、领域事件来帮助领域建模。
《领域驱动设计的基础知识总结》
- 领域（Doamin）本质上就是问题域，比如一个电商系统，一个论坛系统等。
- 界限上下文（Bounded Context）：阐述子域之间的关系，可以简单理解成一个子系统或组件模块。
- 领域模型（Domain Model）：DDD的核心是建立（用通用描述语言、工具—领域通用语言）正确的领域模型；反应业务需求的本质，包括实体和过程；其贯穿软件分析、设计、开发的整个过程；常用表达领域模型的方式：图、代码或文字；
- 领域通用语言：领域专家、开发设计人员都能立即的语言或工具。
- 经典分层架构：用户界面/展示层、应用层、领域层、基础设施层，是四层架构模式。
- 使用的模式：
  - 关联尽量少，尽量单项，尽量降低整体复杂度。
  - 实体（Entity）：领域中的唯一标示，一个实体的属性尽量少，少则清晰。
  - 值对象（Value Object）：没有唯一标识，且属性值不可变，小二简单的对象，比如Date。
  - 领域服务（Domain Service）：协调多个领域对象，只有方法没有状态(不存数据)；可以分为应用层服务，领域层服务、基础层服务。
  - 聚合及聚合根（Aggregate，Aggregate Root）：聚合定义了一组具有内聚关系的相关对象的集合；聚合根是对聚合引用的唯一元素；当修改一个聚合时，必须在事务级别；大部分领域模型中，有70%的聚合通常只有一个实体，30%只有2~3个实体；如果一个聚合只有一个实体，那么这个实体就是聚合根；如果有多个实体，那么我们可以思考聚合内哪个对象有独立存在的意义并且可以和外部直接进行交互；
  - 工厂（Factory）：类似于设计模式中的工厂模式。
  - 仓储（Repository）：持久化到DB，管理对象，且只对聚合设计仓储。
《领域驱动设计(DDD)实现之路》
- 聚合：比如一辆汽车（Car）包含了引擎（Engine）、车轮（Wheel）和油箱（Tank）等组件，缺一不可。
《领域驱动设计系列（2）浅析VO、DTO、DO、PO的概念、区别和用处》

命令查询职责分离(CQRS)

CQRS — Command Query Responsibility Seperation

《领域驱动设计系列 (六)：CQRS》
- 核心思想：读写分离（查询和更新在不同的方法中），不同的流程只是不同的设计方式，CQ代码分离，分布式环境中会有明显体现（有冗余数据的情况下），目的是为了高性能。
《DDD CQRS架构和传统架构的优缺点比较》
- 最终一致的设计理念；依赖于高可用消息中间件。
《CQRS架构简介》
- 一个实现 CQRS 的抽象案例。
《深度长文：我对CQRS/EventSourcing架构的思考》
- CQRS 模式分析 + 12306 抢票案例

贫血，充血模型

《贫血，充血模型的解释以及一些经验》
- 失血模型：老子和儿子分别定义，相互不知道，二者实体定义中完全没有业务逻辑，通过外部Service进行关联。
- 贫血模型：老子知道儿子，儿子也知道老子；部分业务逻辑放到实体中；优点：各层单项依赖，结构清楚，易于维护；缺点：不符合OO思想，相比于充血模式，Service层较为厚重；
- 充血模型：和贫血模型类似，区别在于如何划分业务逻辑。优点：Service层比较薄，只充当Facade的角色，不和DAO打交道、复合OO思想；缺点：非单项依赖，DO和DAO之间双向依赖、和Service层的逻辑划分容易造成混乱。
- 肿胀模式：是一种极端情况，取消Service层、全部业务逻辑放在DO中；优点：符合OO思想、简化了分层；缺点：暴露信息过多、很多非DO逻辑也会强行并入DO。这种模式应该避免。
- 作者主张使用贫血模式。

Actor 模式

TODO

响应式编程

TODO

项目管理

架构评审

重构

TODO

代码规范

RUP

《运用RUP 4+1视图方法进行软件架构设计》

看板管理

《说说看板在项目中的应用》

SCRUM

《敏捷项目管理流程-Scrum框架最全总结！》

极限编程

TODO

敏捷开发

TODO

结对编程

TODO

通用业务术语

TODO

#技术趋势

TODO

#架构师素质

《架构师画像》
- 业务理解和抽象能力
- NB的代码能力
- 全面：1. 在面对业务问题上，架构师脑海里是否会浮现出多种技术方案；2. 在做系统设计时是否考虑到了足够多的方方面面；3. 在做系统设计时是否考虑到了足够多的方方面面；
- 全局：是否考虑到了对上下游的系统的影响。
- 权衡：权衡投入产出比；优先级和节奏控制；
《关于架构优化和设计，架构师必须知道的事情》
- 要去考虑的细节：模块化、轻耦合、无共享架构；减少各个组件之前的依懒、注意服务之间依懒所有造成的链式失败及影响等。
- 基础设施、配置、测试、开发、运维综合考虑。
- 考虑人、团队、和组织的影响。
《如何才能真正的提高自己，成为一名出色的架构师？》
《架构师的必备素质和成长途径》
- 素质：业务理解、技术广度、技术深度、丰富经验、沟通能力、动手能力、美学素养。
- 成长路径：2年积累知识、4年积累技能和祖内影响力、7年积累部门内影响力、7年以上积累跨部门影响力。
《架构设计师—你在哪层楼？》
- 第一层的架构师看到的只是产品本身
- 第二层的架构师不仅看到自己的产品，还看到了整体的方案
- 第三层的架构师看到的是商业价值

团队管理

TODO

资讯

行业资讯

36kr
Techweb

公众号列表

TODO

博客

团队博客

个人博客

综合门户、社区

国内：

CSDN 老牌技术社区、不必解释。
51cto.com
ITeye
- 偏 Java 方向
博客园
ChinaUnix
- 偏 Linux 方向
开源中国社区
深度开源
伯乐在线
- 涵盖 IT职场、Web前端、后端、移动端、数据库等方面内容，偏技术端。
ITPUB
腾讯云— 云+社区
阿里云— 云栖社区
IBM DeveloperWorks
开发者头条
LinkedKeeper

国外：

DZone
Reddit

问答、讨论类社区

行业数据分析

艾瑞网

专项网站

测试:
运维:
- 运维派
Java:
- ImportNew
  - 专注于 Java 技术分享
安全
- 红黑联盟
大数据
- 中国大数据
其他专题网站：
- DockerInfo
  - 专注于 Docker 应用及咨询、教程的网站。
- Linux公社
  - Linux 主题社区

其他类

程序员技能图谱

技术资源

开源资源

github

手册

W3Cschool
Runoob.com
- HTML 、 CSS、XML、Java、Python、PHP、设计模式等入门手册。

在线课堂

会议

工具

极客搜索
- 技术文章搜索引擎。

代码托管

文件服务

七牛
又拍云

综合云服务商

阿里云
腾讯云
百度云
新浪云
金山云

谭晓憨 / architect-all .gitee-modal { width: 500px !important; }

architect-all

数据结构

队列

集合

链表、数组

字典、关联数组

树

二叉树

完全二叉树

平衡二叉树

红黑树

B-，B+，B*树

常用算法

排序、查找算法

选择排序

冒泡排序

插入排序

快速排序

归并排序

堆排序

计数排序

桶排序

基数排序

二分查找

Java 中的排序工具

贪心算法

回溯算法

剪枝算法

动态规划

朴素贝叶斯

推荐算法

并发

多线程

线程安全

一致性、事务

事务 ACID 特性

事务的隔离级别

锁

Java中的锁和同步类

公平锁 & 非公平锁

悲观锁 & 乐观锁 & CAS

ABA 问题

CopyOnWrite容器

RingBuffer

可重入锁 & 不可重入锁

操作系统

计算机原理

进程

线程

协程

Linux

设计模式

23种常见设计模式

责任链模式

MVC

IOC

AOP

UML

微服务思想

康威定律

运维 & 统计 & 技术支持

常规监控

APM

统计分析

持续集成

Jenkins

环境分离

自动化运维

Ansible

puppet

chef

测试

TDD 理论

单元测试

压力测试

全链路压测

A/B Test

虚拟化

KVM

谭晓憨 / architect-all