برای مشاهده یافته ها از کلید Enter و برای خروج از کلید Esc استفاده کنید.

دیتافریم ها: بخش دوم

در ادامه بررسی دیتافریم ها در زبان R، در این بخش عملیات های قابل انجام بر روی دیتافریم ها از قبیل حذف و اضافه کردن مقادیر داده ای معرفی می شوند. البته به این نکته توجه داشته باشید که چون دیتافریم ها داده ها را در قالب سطر و ستون ذخیره می کنند (همانند جدول ها)، اضافه کرده آیتم های داده ای باید هر دو جنبه را پوشش دهد.

اضافه کرد سطر به دیتافریم

اضافه کردن یک سطر جدید به دیتافریم با استفاده از دستور rbind انجام می شود، همانند روشی که برای بردارها انجام دادیم. توجه: برای بررسی دستورهای این بخش، از دیتافریمی که در بخش قبل ایجاد کردیم، استفاده می کنیم.

df_3 <- rbind(df_3, c("R for network analysis", 8, 5))
df_3
#                  course duration sessions
#1         R Data Science       18      6.0
#2             R Graphics       15      4.0
#3          R for Biology       11      3.5  
#4 R for network analysis        8        5

اضافه کرد ستون به دیتافریم

فرایند اضافه کردن ستون به دیتا فریم هم همانند بردارها بوسیله دستور cbind انجام می شود. برای انجام این عملیات باید توجه داشته باشیم که تعداد مقادیر ستون جدید به اندازه تعداد سطرهای دیتافریم موجود باشد، در غیر اینصورت با پیغام خطا روبه رو خواهیم شد. همچنین باید برای ستون جدید نامی هم درنظر گرفته شود.

df_3 <- cbind(df_3, rank = c("A","C","B","A"))
df_3
#                  course duration sessions rank
#1         R Data Science       18      6.0    A
#2             R Graphics       15      4.0    C
#3          R for Biology       11      3.5    B
#4 R for network analysis        8        5    A

با استفاده از دستورهای rbind و cbind همچنین می توان چند دیتافریم را به صورت عمودی و افقی با یکدیگر ترکیب کرد. منظور از ترکیب عمودی، ترکیب سطرها با یکدیگر است و مقصور از ترکیب افقی ترکیب ستون های دیتافریم هاست.

حذف سطر و ستون از دیتافریم

برای حذف سطر و ستون از دیتافریم ها هم از دستور ()c استفاده می کنیم ولی با اندیس منفی به این صورت که به اندیس سطر یا ستون موردنظر با علامت منفی اشاره می کنیم.

df_3 <- df_3 [c(-1),c(-1)]
df_3
#    duration sessions rank
#2         15      4.0    C
#3         11      3.5    B
#4          8        5    A

همانطور که مشاهده می کنید، دستور بالا باعث حذف شدن سطر و ستون اول از دیتافریم شد. طبیعتا با آدرس دهی به یک سطر یا ستون خاص، می توان تنها آن سطر و ستون خاص را از دیتا فریم حذف کرد.

بررسی ابعاد دیتافریم

ابعاد یک دیتافریم را می توان از سه جنبه بررسی کرد، به صورت کلی، تعداد سطرها و تعداد ستون ها. این عملیات به صورت زیر انجام می گیرد.

dim(df_3)
# [1] 3 2
ncol(df_3)
# [1] 2
nrow(df_3)
# [1] 3

همچنین، برای آگاهی از طول دیتافریم (تعداد ستون ها)، می توان از دستور length هم استفاده کرد.

برای کسب اطلاعات بیشتر درباره انواع داده ای موجود در دیتافریم و ساختار آن، از دستور عمومی str استفاده می شود. با اینحال، از به دنبال اطلاعات دقیقتری از ساختار دیتافریم موردنظرتان هستید، دستور attributes بسیار کاربردی خواهد بود.