Node.js – 检索文件字符编码
计算机系统在位上工作。同样,计算机将文件读取为二进制表示,这就是我们需要将文本字符转换为二进制数据的原因。最流行的字符编码类型是:ASCII和Unicode。Unicode有另外两种类型:utf8和utf16。
语法
detectCharacterEncoding(filePath)
设置环境和执行:
StepI- 初始化节点项目。
npm init
步骤II- 安装所需的模块。
npm install detect-character-encoding
步骤III-传递需要编码的文本文件名。
示例1
创建一个文件“abc.txt”,内容如下:“Welcometonhooo.com”并将其保存在项目目录中。
创建一个名为“charEncoding.js”的文件并复制以下代码片段。创建文件后,使用命令“charEncoding.js”运行此代码。
//获取字符编码示例
// Importing the fs & characterEncoding module
const fs = require('fs');
const detectCharacterEncoding = require('detect-character-encoding');
//传递文件名
const fileBuffer = fs.readFileSync('abc.txt');
const charsetMatch = detectCharacterEncoding(fileBuffer);
console.log(charsetMatch);输出结果C:\home\node>> node charEncoding.js
{ encoding: 'ISO-8859-1', confidence: 44 }示例2
创建一个文件“sample.txt”,内容如下:“1234567890”并将其保存在项目目录中。
//获取字符编码示例
// Importing the fs & characterEncoding module
const fs = require('fs');
const detectCharacterEncoding = require('detect-character-encoding');
//传递文件名
const fileBuffer = fs.readFileSync('sample.txt');
const charsetMatch = detectCharacterEncoding(fileBuffer);
console.log(charsetMatch);输出结果C:\home\node>> node charEncoding.js
{ encoding: 'UTF-8', confidence: 15 }