- 文本数据挖掘:基于R语言
- 黄天元编著
- 215字
- 2025-02-22 14:08:51
第3章 从基础做起1——字符串的基本处理
本章概述:
我们已经知道R语言中有字符型的数据结构,字符串是指由多个单字符构成的长文本,这种非结构化的数据结构中往往包含着价值。本章将会阐述如何在R中对这些字符串进行基本的清洗与统计,主要使用stringr包中的函数。学习完本章后,读者将会习得如何对字符串进行拼接、拆分、计数等基本操作,从而为后面学习更加高级的文本分析实现奠定基础。在学习本章之前,需要先加载stringr包,这个包是tidyverse包的一部分,直接加载tidyverse包即可。
