NodeJS问题集萃

这篇放上一些关于Node.JS的问题总结，有助于对NodeJS加深理解。

node modules 中，exports 及 module.exports 的区别？

需要注意，模块导出返回的永远是module.exports

(1) 两者关系：

exports 是 module.exports 的引用

(2) 何时使用 exports 何时使用 module.exports:

module.exports 一般用于导出指定的对象类型:
如module.exports = new Gift();
exports 一般导出的是模块实例:
如exports.PI = 3.1415;

描述一下 require 一个 module 的过程？

检查 module._cacahe 是否已经缓存了模块.
如果没有缓存，则创建一个新的模块实例并且存入缓存.
根据所给的模块名调用 module.load() 方法，load 完毕后会调用 module.compile() 方法进行编译.
如果装载/编译过程中出现了错误，则会抛出错误并且将错误的模块从缓存中移除.
最后返回所依赖的模块: module.exports

哪些后缀扩展名的文件会被自动识别并require ？

require 默认会加载.js、.json、.node 格式的文件

解释一下同步和异步以及阻塞与非阻塞？

同步异步关注的是: 消息通信机制 (发生调用是否立即返回)
同步即在发生调用时，在没有得到结果时，该调用不会返回，待得到结果后，调用才会返回；
异步即在发生调用时，在没有得到结果时，该调用直接返回，待得到结果后，通过状态、消息通知调用者，或通过回调函数处理该调用；
阻塞与非阻塞关注的是: 程序等待调用结果时的状态 （当前线程是否被挂起）
阻塞即指调用结果返回前，当前线程会被挂起，直到得到结果返回；
非阻塞即指调用结果返回前，该调用不会阻塞挂起当前线程；
怎样理解阻塞非阻塞与同步异步的区别

什么是C10K问题，聊聊它的技术变革及演进方向？

C10K即单机1万个并发连接情况下，硬件性能足够，但依然无法提供正常服务的问题；
C10K问题是计算机从PC时代变迁到互联网时代的过程中因并发量剧增而逐渐出现问题；
C10K问题特点: 并发性能与硬件性能成非线性
解决C10K问题的关键: 尽可能减少CPU等核心计算资源消耗，防止榨干单台服务器的性能；

(1) 技术变革与演进方向

1. 每个进程/线程处理一个连接

2. 每个进程/线程处理多个连接（即：IO多路复用）

2.1 Select 方案

同时监控多个文件句柄，逐个排查IO句柄状态，若准备好了就处理
缺点：有句柄上限、重复初始化、逐个排查所有文件句柄效率低；

2.2 Poll 方案

Poll 方案在 Select 方案基础上解决了句柄上线和重复初始化的问题，效率有所提高；
缺点：仍然存在逐个排查所有文件句柄的问题，在句柄变多后，处理效率会变差；

2.3 Epoll 方案

Epoll 方案采用仅排查当前发生状态变化的文件句柄的设计，使得排查句柄的效率得到提升；
Nginx、libevent、libev、NodeJS的libuv 都是基于Epoll方案；
缺点：不能跨平台，Linux 使用 epoll, FreeDSD 使用 kqueue, windows 使用 IOCP;

2.4 Libevent库

考虑到跨平台和移植，libevent 库将不同平台的 epoll、kqueue、IOCP 等进行了封装整合；

3. 采用协程的方式处理

使用进程/线程的方式处理并发请求时，在进行系统调度时切换系统上下文的代价是很高的，且进程/线程作为处理单元太厚重，于是诞生了一种轻量级的处理单元，协程；
如 Python、Lua 提供的 coroutine 模型，Go 提供的 goroutine 模型；
特点：占用资源少、避免系统调度过程中的上下文切换、用户代码实现无需内核参与；

C10K 问题引发的技术变革
 事件驱动与协程：基本概念介绍
 上一个10年，著名的C10K并发连接问题

什么是libuv? 在NodeJS中的作用是什么？

libuv是一个高性能的事件驱动IO库，它封装了比libevent设计简练且性能更好的libev，
但是由于libev对于windows平台支持有限，所以libuv又在库中加入了windows的IOCP，以支持跨平台；
libuv 提供了非阻塞网络请求、各平台的事件轮询方法等；

libuv 是 NodeJS 实现事件循环 Event-Loop 的关键；

什么是事件驱动？什么是事件循环？

(1) 事件驱动

事件驱动指持续事务管理过程中决策的一种策略，即跟随当前时间点上出现的事件，调动可用资源，执行相关任务，使不断出现的问题得以解决，防止事务堆积;

事件驱动并非NodeJS独有的功能，它是作为一概念引入到NodeJS;

NodeJS主线程执行时，会启动事件循环（Event Loop）进行轮询监听和捕获事件，当一个IO事件触发时，会将其放入事件循环队列，同时会立即返回主线程而不会阻塞，这样保证了主线程可以处理其他事件而不会等待，此时，事件循环里的事件等待执行处理结果，若得到结果，则会调用相应的回调函数；

NodeJS的事件循环是有libuv处理的；

什么是调用栈？

调用堆栈是JS代码执行的基本机制。

当调用一个函数时，会将函数参数和返回值地址推送到堆栈。

这样允许运行时知道函数结束后继续执行代码的位置。

NodeJS的调用栈有V8处理；

由于调用栈的栈采用的是后进先出的方式，
故在语法解析完毕后，主函数首先被push到栈底，文件头的首个函数被存入栈顶；
而在执行过程中，则先执行栈顶的函数，然后依次执行后续函数，直到执行到最后的主函数；

setImmediate 与 process.nextTick 的关系？

首先，在NodeJS中事件执行的顺序是，同步任务先于异步任务执行，异步中本轮循环先于次轮循环执行；

本轮循环的异步任务按先后阶段顺序包括两个队列：

nextTickQueue (如：process.nexTick())
microTaskQueue (如：Promise)

次轮循环的阶段顺序：

timers (setTimeout() setInterval())
I/O callback (其他类型的回调)
idle (libuv内部调用)
poll (等待没有返回的IO事件)
check (setImmdiate())
close callbacks (close关闭事件的回调)

setImmediate()在此轮循环的check阶段，而process.nextTick()位于本轮循环的nextTickQueue当中；

process.nextTick()先于setImmediate()执行；

child_process 模块的 spawn、exec、fork主要区别是什么？

child_process.spawn(): 异步的衍生子进程，不会阻塞NodeJS事件循环；
child_process.spawnSync(): 同步的衍生子进程，会阻塞事件循环，直到子进程退出终止；
child_process.exec(): 衍生一个shell并执行命令，完成时会输出stdout和stderr到回调函数；
child_process.fork(): 衍生一个NodeJS进程，并通过IPC通道实现父子进程通信；

cluster 模块的工作原理？

由于NodeJS是单进程的，无法充分利用多核，因此需要启动多个进程满足高负载的处理需求；

cluster 即可以创建并管理多个子进程并共享端口；

Cluster 基于child_process.fork()实现工作进程的复制；

cluster 通过一个主进程接收请求或连接，并通过循环的方式分发请求给创建的多个子进程进行处理，从而做到简单的负载均衡；

如何查看NodeJS进程占用的内存？

程序外，通过进程内存查看工具
程序内，通过process.memoryUsage()查看

如何在NodeJS进程退出前做最后的操作，操作是否可以异步执行？

可以注册一个exit事件监听，通过process.on('exit',cb),该操作不可异步；

NodeJS依赖有哪些？

库依赖：v8、libuv、http-parser、c-ares、openSSL、zlib
工具依赖：npm、gyp、gtest

同样是实现异步操作，回调 callback 与事件 emitter 有什么区别?

emitter 更加灵活，可以将执行的过程发送到别的地方，只要有方法监听这个事件就能够收到；
callback 则只能在本函数或本文件内执行，相对比较固定；

NodeJS性能如何优化？

IO层面的优化

性能的瓶颈往往在 IO，主要会涉及到数据层的优化；

添加索引

索引具有占用空间小，数据结构B-tree方便查询的特点

首先开启数据库慢查询；
其次获取profile信息找到具体问题；
最后分析需要加索引的字段，并添加索引；

添加缓存

内存IO要快于磁盘IO，所以可以使用redis缓存数据；
同时缓存数据是有代价的，会存在缓存更新及失效等问题；
所以，要选择访问频率高、生成代价高的数据进行缓存；

合并IO操作

减少IO操作能够有效提高性能，特别对于循环操作IO的地方，
以及多条冗余查询的操作，我们可以尽量使用更少的IO操作，达到同样的实现目的；

CPU层面的优化

NodeJS对于CPU密集的任务处理是不胜任的，所以要尽量减少CPU密集计算；
可以将CPU密集计算交由其他擅长的方式来处理；

MySQL性能优化技巧？

查询优化

避免使用select *；
用JOIN代替子查询；
适当添加冗余字段减少表关联；
合理使用索引，如排序，分组字段；

使用索引

频繁作为查询条件的字段
关联其他表的字段
查询排序的字段
用于分组的字段

选择适合的数据类型

选择能存放数据最小的数据类型；
使用简单的数据类型，int代替varchar;
使用tinyint、smallint、mediumint代替int;
尽可能使用not null,由于null要占用4字节；
尽量少用text类型；
使用timestamp代替datetime；
单表字段不要太多，20个之内；

表结构拆分

垂直拆分
将表按字段整理拆分成不同的表，如常访问的字段拆分为一张表，不常访问的拆分为另一张表；
水平拆分
表条目数过多时，使用水平拆分，按照条目的id或日期等规则字段进行拆分；

koa2的中间件原理

// todo

对websocket的理解，及其在NodeJS中的应用