我想通過分析自己每月消費數(shù)據(jù),了解消費結構和趨勢,但是在數(shù)據(jù)讀?。ㄏ駨?Excel 表格讀取數(shù)據(jù))和清洗(處理缺失值、異常值等)方面,我不太清楚 R 語言中有哪些好用的函數(shù)或包可以讓我順利開展這個小項目。
數(shù)據(jù)讀取
基礎函數(shù):
read.csv()
read.table()
load()
save()
readRDS()
高效讀取包:
read_csv()
read_tsv()
fread()
read_excel()
處理缺失值:
is.na()
na.omit()
na.fill()
na.approx()
na.rm = TRUE
處理重復值:
duplicated()
unique()
數(shù)據(jù)轉換:
as.factor()
as.numeric()
as.character()
scale()
normalize()
數(shù)據(jù)篩選和篩選:
subset()
filter()
select()
數(shù)據(jù)合并:
merge()
rbind()
cbind()
數(shù)據(jù)分組和匯總:
group_by()
summarize()
其他清洗工具:
separate()
unite()
gather()
*()
str_replace()
str_trim()
str_to_lower()