Cách phân tích thống kê mô tả dữ liệu

thongke.mota1 FILEminimizer 1024x576 - Cách phân tích thống kê mô tả dữ liệu

Phân tích thống kê mô tả dữ liệu là một bước quan trọng nhất trong phân tích định lượng, bất cứ nghiên cứu mô hình định lượng nào thì cũng cần phải nghiên cứu thống kê mô tả cả, tuy cách làm tương đối đơn giản những cũng nhiều bạn còn gặp khó khăn trong việc phải mô tả dữ liệu, đây là bước quan trọng để người dùng đọc hiểu bộ dữ liệu cơ bản ban đầu của chúng ta, nó rất quan trọng

THỐNG KÊ MÔ TẢ DỮ LIỆU

Phân tích thống kê mô tả là gì ?

Định nghĩa thống kê mô tả

Thống kê mô tả được sử dụng để mô tả các tính năng cơ bản của dữ liệu trong một nghiên cứu. Chúng cung cấp các bản tóm tắt đơn giản về mẫu và các biện pháp. Cùng với phân tích đồ họa đơn giản, chúng tạo thành nền tảng của hầu như mọi phân tích định lượng dữ liệu.

Thống kê mô tả thường được phân biệt với thống kê suy luận . Với thống kê mô tả, bạn chỉ đơn giản là mô tả những gì đang có hoặc những gì dữ liệu hiển thị. Với số liệu thống kê suy luận, bạn đang cố gắng đưa ra kết luận vượt ra ngoài dữ liệu tức thời. Ví dụ: chúng tôi sử dụng thống kê suy luận để cố gắng suy ra từ dữ liệu mẫu xem dân số có thể nghĩ gì.

ĐỌC:  Nhận xử lý data thống kê R Statistical Spss Eviews Stata 1

Hoặc, chúng tôi sử dụng thống kê suy luận để đưa ra phán đoán về xác suất sự khác biệt quan sát được giữa các nhóm là một hoặc một sự khác biệt đáng tin cậy có thể xảy ra một cách tình cờ trong nghiên cứu này. Do đó, chúng tôi sử dụng thống kê suy luận để đưa ra suy luận từ dữ liệu của chúng tôi đến các điều kiện tổng quát hơn; chúng tôi sử dụng thống kê mô tả chỉ để mô tả những gì đang diễn ra trong dữ liệu của chúng tôi.

Ứng dụng mô tả dữ liệu

Để mô tả dữ liệu thì chúng ta có thể dùng trên tất cả phần mêm thống kê hiện này, nhưng dễ hiểu và trực quan nhất vẫn là SPSS, Stata, R, … Eviews; .Nới chung bạn chọn phần mềm nào cũng được, ở đây chúng tôi chọn phần mềm tương tác giao diện đồ hoạ cho các bạn dễ làm theo.

Chạy trên Eviews:

Chọn tất cả dữ liệu => Open as Group = > Descriptives statistics

Ta được kết quả như sau:

thongkemotaeviews - Cách phân tích thống kê mô tả dữ liệu
Thống kê mô tả trên Eviews

Chạy trên SPSS

Analyze => Descriptive Statistics => Descriptive

thongkemotaspss1 1024x311 - Cách phân tích thống kê mô tả dữ liệu
Thống kê mô tả trên SPSS

Ta chạy trên SPSS thì kết quả cũng tương tự vậy thôi

Bạn chạy trên các phần mềm khác khác và kết quả tương tự, trong bài phân tích biến rời rạc và biến liên tục chúng tôi có nhắc tới sai lầm thường xuyên của các bạn khi phân tích thống kê mô tả, ta chỉ phân tích thống kê mô tả trên các biến liên tục, còn biến rời rạc thì chúng ta phân tích tần suất ( ở phần sau), còn phân tích thống kê mô tả cho biến rời rạc thì vô nghĩa.

ĐỌC:  Tạp chí mở VS tạp chí đóng, cái nào uy tín hơn ?

Nội dung phân tích

  • Obs/N: số lượng quan sát – Mục đích là xem trong dữ liệu biến X có bao nhiêu quan sát thôi.
  • Mean: Giá trị trung bình, đây là giá trị quan trọng của biến liên tục, còn biến rời rạc mà lấy giá trị trung bình thì không có nghĩa gì hết.
  • Min: Giá trị nhỏ nhất, đây là giá trị quan trọng để xem bộ dữ liệu của ta có hợp lí không ?
  • Max:  Giá trị lớn nhất, cũng là giá trị quan trọng  để xem bộ dữ liệu hợp lí không?
  • sd: Độ lệch chuẩn, đây là một giá trị của biến định lượng, luôn đi song hành với giá trị mean

Phân tích tần suất

Phân tích tần suất là phân tích cho những biến rời rạc, không dùng cho biến liên tục, nó ngược lại thống kê mô tả ở trên.

Thống kê tần suất là mô tả dữ liệu nó xuất hiện bao nhiều lần trong dữ liệu

Chạy trên SPSS

tansuatspss1 - Cách phân tích thống kê mô tả dữ liệu
Thống kê tần suất trên SPSS

Chúng ta chạy tần suất cho 3 biến rời rạc là GENDER KHMER và EDU

Chạy trên Eviews

Trên Eviews thì bạn phải chạy cho từng biến, rất mất thời gian, nên chúng tôi không đưa hình ảnh mình hoạ vào đây.

Nội dung phân tích

Tôi dùng dữ liệu KHMER là ví dụ:

  • 0: nam
  • 1: Nữ

Ta có Nam chiếm 308 quan sát và chiếm 61,8 % còn lại là nữ

Vẽ đồ thị

Vẽ đồ thị line cho biến liên tục

Vẽ trên Eviews:

Mở dữ liệu có tên là LEND => View = > Graph ( Để mặc định hết)

ĐỌC:  Bài báo khoa học P4: Kết quả nghiên cứu
line.lend1  - Cách phân tích thống kê mô tả dữ liệu
Vẽ đồ thị line

Vẽ trên SPSS

Bạn vào mục Graph => Chart Builder = > Line

Kết quả cũng ra tương tự:

dothi.line .spss1  - Cách phân tích thống kê mô tả dữ liệu
Mô tả dữ liệu qua LEND với TIME

Vẽ đồ thị cột cho biến tần suất

Vẽ trên SPSS:

Trong mục chạy tần suất bạn vào mục Charts => Bar charts

tansut.spss  - Cách phân tích thống kê mô tả dữ liệu
Chạy tần suất dữ liệu trên SPSS

Kết luận:

Chạy thống kê mô tả, trên là nội dung chính, các bạn có thể chạy thêm nhiều thứ khác nữa, mô tả dữ liệu làm sao cho người đọc họ dễ dàng trong việc hiểu được bộ dữ liệu của chúng ta nhất, và đây cũng là phần quan trọng để họ xem bộ dữ liệu cho chúng ta có phù hợp hay không?

Còn phần mềm nào sử dụng cũng được, riêng về thống kê dữ liệu bạn nên dùng SPSS cho ra kết quả trực quan và đẹp hơn các phần mềm khác như: R, Stata, Eviews … SPSS chỉ yếu khi các bạn học lên Cao học / Nghiên cứu sinh làm khoa học chuyên nghiệp, nó thiếu nhiều model định lượng quan trọng và mới, còn các bạn học Đại học thì nó quá đủ để dùng.

Trong thống kê mô tả data thì SPSS quá dễ để dùng.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *