MỘT SỐ CÔNG CỤ XỬ LÝ SỐ LIỆU TRONG NGHIÊN CỨU KHOA HỌC – Khoa học trẻ TST

Trong điều tra và nghiên cứu khoa học, quy trình nghiên cứu và phân tích dữ liệu được các nhà nghiên cứu sử dụng để gia giảm dữ liệu và diễn giải nó nhằm mục đích rút ra những hiểu biết. Quá trình nghiên cứu và phân tích dữ liệu giúp giảm một lượng lớn dữ liệu thành các phần nhỏ hơn, điều này làm nó có ý nghĩa hơn. Có 03 điều thiết yếu diễn ra trong quy trình nghiên cứu và phân tích dữ liệu, tiên phong là tổ chức triển khai dữ liệu. Thứ hai, tóm tắt và phân loại dữ liệu nhằm mục đích góp thêm phần đưa ra phương pháp sử dụng để giảm dữ liệu – Nó giúp tìm kiếm các mẫu và chủ đề trong dữ liệu để thuận tiện xác lập và link biến số. Thứ ba, cách sau cuối là nghiên cứu và phân tích dữ liệu – các nhà nghiên cứu thực thi theo cả cách từ trên xuống hoặc từ dưới lên nhằm mục đích tiến hành nghiên cứu và điều tra từ các biến số đó. Có thể nói rằng, nghiên cứu và phân tích và nhìn nhận dữ liệu là một quy trình biểu lộ ứng dụng logic suy diễn và quy nạp vào nghiên cứu và điều tra và nghiên cứu và phân tích dữ liệu .
Đối với biến số định lượng, việc xử lý dữ liệu bằng các ứng dụng là bắt buộc nhằm mục đích đơn giản hóa quy trình xử lý dữ liệu và chạy quy mô để ship hàng diễn giải, nhìn nhận tác dụng. Tuy nhiên, việc lựa chọn ứng dụng nào cần nhờ vào vào đặc thù nguồn dữ liệu. Việc lựa chọn các thống kê cơ bản và loại test kiểm định thống kê dựa vào dạng thống kê ( diễn đạt, đối sánh tương quan, so sánh ) và đặc thù của biến số đó. Sau khi đã tích lũy, xử lý và quản trị dữ liệu, tất cả chúng ta triển khai nghiên cứu và phân tích dữ liệu. Có nhiều cách nghiên cứu và phân tích tùy theo phong cách thiết kế điều tra và nghiên cứu, nhưng nói chung việc nghiên cứu và phân tích dữ liệu thống kê thường có ba dạng : Phân tích thống kê để diễn đạt 1 biến số ; Phân tích thống kê để tìm đối sánh tương quan giữa hai biến số ; Phân tích thống kê để so sánh giữa các biến số. Trong một phong cách thiết kế nghiên cứu và điều tra hoàn toàn có thể sử dụng 1, 2 hay cả 3 dạng nghiên cứu và phân tích trên. Nếu là biến phân loại ta nghiên cứu và phân tích tỷ suất, biến liên tục phân phối chuẩn ta nghiên cứu và phân tích giá trị trung bình và trường hợp biến liên tục không phân phối chuẩn ta nghiên cứu và phân tích giá trị trung vị .
Một số công cụ xử lý dữ liệu định lượng thực thi bởi các ứng dụng được trình diễn như bên dưới đây :

1. Microsoft Excel

Microsoft Excel là một ứng dụng trong bộ ứng dụng Microsoft Office chuyên về xử lý dữ liệu bảng tính. Ra đời phiên bản tiên phong từ năm 1987, trải qua hơn 30 năm hình thành và tăng trưởng bởi công ty ứng dụng nổi tiếng nhất quốc tế Microsoft, Excel đã trở thành ứng dụng bảng tính thông dụng nhất quốc tế. Hiện nay, Microsoft Excel đã xuất hiện trên nhiều nền tảng hệ quản lý và điều hành như Windows, MacOS, Android, IOS, …
Các ứng dụng chính của Excel trong xử lý dữ liệu gồm có :

  • Thống kê dữ liệu, trong đó có cả thống kê một cách trực quan dựa vào bảng, biểu đồ, dashboard…
  • Phân phối xác suất.
  • Tính toán tương quan và hồi quy tuyến tính.
  • Kiểm định các giả thiết.
  • Phân tích tình huống.

Ngoài ra, trong các phiên bản Excel mới có rất nhiều tính năng tương hỗ thao tác hữu dụng như đồng nhất hóa, thao tác trên nhiều thiết bị cùng một lúc, Dự kiến dữ liệu thống kê, công cụ dịch nhanh, giao diện đẹp … Tuy nhiên, Microsoft Excel cũng còn nhiều hạn chế như :

  • Tốn chi phí bản quyền để có thể sử dụng một cách hợp pháp.
  • Cần nhiều thời gian và công sức để sử dụng thành thục các tính năng, các hàm…
  • Với các máy tính có cấu hình từ trung bình trở xuống, tốn nhiều thời gian và tài nguyên trên máy để mở các file dữ liệu lớn.
  • Cách làm việc trên các file phụ thuộc vào thói quen của từng người sử dụng, nên khó làm việc chung.
  • Khả năng bảo mật kém.

2. Stata

Stata là ứng dụng quản trị dữ liệu, thiết kế xây dựng biểu đồ và đặc biệt quan trọng là phân tích số liệu định lượng, do hãng StataCorp phát hành lần đầu năm 1985. Stata đặc biệt quan trọng điển hình nổi bật nhờ các bộ câu lệnh có sẵn đồng thời lại sử dụng mã nguồn mở, được cho phép người dùng tự soạn công thức và câu lệnh riêng tương thích với nhu yếu sử dụng của mình .
Stata được cho phép người dùng sử dụng nhiều loại dữ liệu, ví dụ như dữ liệu ASCII hoặc bảng tính Microsoft Excel. Dữ liệu được xử lý xong cũng hoàn toàn có thể được xử lý bằng những ứng dụng khác .
Một ưu điểm lớn của Stata chính là việc ứng dụng này sử dụng mã nguồn mở. Điều này được cho phép người dùng sử dụng những file “ chuyên được dùng ” tải về từ internet. Một trong những hội đồng tương hỗ lớn nhất dành cho người dùng Stata là Statalist. Ở forum này, người dùng hoàn toàn có thể upload cũng như tải về các file chuyên được dùng Giao hàng cho những mục tiêu riêng không liên quan gì đến nhau .
Bên cạnh những ưu điểm trên, Stata cũng có một số ít điểm yếu kém. Thứ nhất, ứng dụng này chỉ hoàn toàn có thể xử lý một bộ dữ liệu trong một lần mở. Hơn nữa, ứng dụng được cài đặt để tàng trữ hàng loạt bộ dữ liệu đang được xử lý, gây trở ngại cho quy trình quản lý và vận hành nếu bộ dữ liệu đó có dung tích quá lớn. Một điểm yếu kém nữa là những file “ chuyên được dùng ” của Stata chưa được thẩm định tính đúng chuẩn, vì thế người dùng cần tâm lý và kiểm tra kĩ trước khi sử dụng chúng .
Một số website bạn hoàn toàn có thể tìm nguồn hướng dẫn cho công cụ này là :

3. SPSS

SPSS ( viết tắt của Statistical Package for the Social Sciences ) là một ứng dụng máy tính ship hàng công tác làm việc nghiên cứu và phân tích thống kê. Hiện SPSS ngày càng được sử dụng nhiều hơn trong nghiên cứu và điều tra thị trường và cả nghành nghề dịch vụ quản trị. SPSS cung ứng một mạng lưới hệ thống quản trị dữ liệu và năng lực nghiên cứu và phân tích thống kê với giao diện đồ họa thân thiện .
Nội dung của SPSS rất đa dạng chủng loại và phong phú, từ việc phong cách thiết kế các bảng biểu và sơ đồ thống kê, thống kê giám sát các đặc trưng mẫu trong thống kê diễn đạt, đến một mạng lưới hệ thống vừa đủ các phương pháp thống kê nghiên cứu và phân tích như :

  • So sánh các bảng mẫu bằng nhiều tiêu chuẩn tham số và phi tham số (Nonparametric Test, các mô hình phân tích phương sai theo dạng tuyến tính tổng quát (General Linear Models), các mô hình hồi quy đơn biến và nhiều biến, các hồi quy phi tuyến tính (Nonlinear), các hồi quy Logistic.
  • Phân tích theo nhóm (Cluster Analysis).
  • Phân tích tách biệt (Discriminatory Analysis).
  • Chuyên sâu khác (Advanced Statistics).

Các tính năng chính của SPSS gồm có :

  • Nhập và làm sạch dữ liệu.
  • Xử lý biến đổi và quản lý dữ liệu.
  • Tóm tắt, tổng hợp dữ liệu và trình bày dưới dạng biểu bảng, đồ thị bản đồ.
  • Phân tích dữ liệu, tính toán các tham số thống kê và diễn giải kết quả.

SPSS là phần mềm xử lý thông tin sơ cấp – thông tin được thu thập trực tiếp từ đối tượng nghiên cứu. Thông tin được xử lý là thông tin định lượng (có ý nghĩa về mặt thống kê). SPSS là một hệ thống phần mềm thống kê toàn diện được thiết kế để thực hiện tất cả các bước trong các phân tích thống kê từ những thống kê mô tả (liệt kê dữ liệu, lập đồ thị) đến thống kê suy luận (tương quan, hồi quy…).

SPSS được các nhà nghiên cứu sử dụng thoáng đãng cho các điều tra và nghiên cứu trong các nghành nghề dịch vụ :

  • Tâm lý học, tội phạm học.
  • Điều tra xã hội học.
  • Nghiên cứu kinh doanh.
  • Nghiên cứu trong y sinh.

Một số website bạn hoàn toàn có thể tìm nguồn hướng dẫn cho công cụ này là :

  • http://nghiencuudinhluong.com/
  • http://hotrospss.blogspot.com/
  • http://phantichspss.com/
  • http://phantichspss.blogspot.com/
  • https://www.youtube.com/channel/UC8Q-4C0Xbymg3I54Gd1ZQbQ/videos
  • https://www.youtube.com/channel/UCJPGPQB8RwDHUou21_T9zMA/videos 

tin tức nơi dạy SPSS : http://khoahoctre.com.vn/chieu-sinh-hoc-vien-lop-phan-tich-du-lieu-spss-khoa-thang-5-2022/

4. R

R là ứng dụng sử dụng cho nghiên cứu và phân tích thống kê và vẽ biểu đồ, là ngôn từ máy tính đa năng, hoàn toàn có thể sử dụng cho nhiều tiềm năng khác nhau :

  • Tính toán đơn giản.
  • Toán học giải trí (recreational mathematics).
  • Tính toán ma trận (matrix).
  • Phân tích thống kê phức tạp.

Công cụ này hoàn toàn có thể tăng trưởng thành các ứng dụng trình độ cho một yếu tố đo lường và thống kê riêng biệt .
* Ưu điểm :

  • Miễn phí, nguồn mở.
  • Khả năng phân tích biểu đồ tuyệt vời.
  • Gắn liền với giới học thuật: được sử dụng trong hầu hết những mô hình thống kê mới nhất.
  • Chạy được trên nhiều hệ điều hành.

* Hạn chế :

  • Dùng lệnh, không dùng menu giống Excel.
  • Nhiều thư viện/package: khó chọn.

Một số nguồn hướng dẫn cho công cụ này là :

  • Phân tích số liệu và biểu đồ bằng R – GS Nguyễn Văn Tuấn.
  • Ngôn ngữ lập trình R – Đỗ Thanh Nghị.
  • Kinh tế lượng ứng dụng với R – Nguyễn Chí Dũng.
  • Ứng dụng phần mềm R tại Việt Nam – Lê Văn Tuấn.

 5. Eviews

EViews ( Econometric Views ) là ứng dụng chuyên về kinh tế tài chính lượng, điều tra và nghiên cứu với dữ liệu chuỗi thời hạn, dữ liệu chéo, dữ liệu mảng … EViews chạy trên Windows, được kiến thiết xây dựng bởi quantitative Micro Software ( QMS ), phiên bản 1.0 được phát hành vào tháng 3/1994 .
Với năng lực linh động trong thao tác, quản trị dữ liệu thuận tiện, tác dụng hiển thị nhanh và thuận tiện hiểu được đã giúp Eviews đang trở thành một trong những ứng dụng thống kê và nghiên cứu và phân tích dữ báo được các nhà nghiên cứu sử dụng thông dụng nhất .

Ngoài những chức năng dùng mô hình kinh tế lượng để phân tích phương trình hồi quy thì một số chức năng dùng cho phân tích dự báo nâng cao như:

  • Thống kê mô tả dữ liệu.
  • Phân tích sự tác động của các yếu tố kinh tế vĩ mô lên biến cần nghiên cứu.
  • Dự báo cho tương lai yếu tố cần nghiên cứu (ví dụ giá xăng dầu, dự báo nhu cầu năng lượng, dự báo giá vàng….).
  • Thực hiện xếp hạng tín dụng trong ngân hàng.
  • Tính toán giá trị rủi ro cho mã cổ phiếu dựa trên tỷ suất sinh lời.
  • Phân tích quan hệ tương quan giữa các yếu tố kinh tế vĩ mô.

Một số nguồn hướng dẫn cho công cụ này là :

  • Hướng dẫn thực hành Kinh tế lượng bằng phần mềm Eviews (Bùi Dương Hải).
  • Hướng dẫn sử dụng phần mềm Eviews (Nguyễn Trung Đông – Nguyễn Văn Phong).
  • Hướng dẫn thực hành kinh tế lượng bằng phần mềm Eviews (Trần Đức Luân).
  • Mô hình ARIMA (Nguyễn Ngọc Thiệp).

( Nguồn : Tổng hợp )

MỘT SỐ CÔNG CỤ XỬ LÝ SỐ LIỆU TRONG NGHIÊN CỨU KHOA HỌC – Khoa học trẻ TST

Bài viết liên quan
Hotline 24/7: O984.666.352
Alternate Text Gọi ngay