Cung cấp dịch vụ phân tích số liệu kinh doanh học thuật; Chúng tôi cung cấp đầy đủ các dịch vụ về phân tích số liệu học thuật như: chạy mô hình định lượng, trực quan hoá số liệu, hướng dẫn định lượng, cung cấp số liệu …, Song song với đó chúng tôi cũng cung cấp những dịch vụ chuyên nghiệp cho doanh nghiệp như: phân tích dữ liệu kinh doanh DA, phân tích nghiệp vụ kinh doanh BA, phân tích kinh doanh thông minh BI, nghiên cứu dự báo bằng trí tuệ nhân tạo …
DỊCH VỤ PHÂN TÍCH SỐ LIỆU
Phân tích dữ liệu là gì ?
Phân tích dữ liệu là quá trình áp dụng một cách có hệ thống các kỹ thuật thống kê và / hoặc lôgic để mô tả và minh họa, cô đọng và tóm tắt cũng như đánh giá dữ liệu. Theo Shamoo và Resnik (2003) các quy trình phân tích khác nhau “cung cấp một cách rút ra các suy luận quy nạp từ dữ liệu và phân biệt tín hiệu (hiện tượng quan tâm) với nhiễu (dao động thống kê) có trong dữ liệu” ..
Trong khi phân tích dữ liệu trong nghiên cứu định tính có thể bao gồm các thủ tục thống kê, nhiều khi phân tích trở thành một quá trình lặp đi lặp lại liên tục, nơi dữ liệu liên tục được thu thập và phân tích gần như đồng thời. Thật vậy, các nhà nghiên cứu thường phân tích các mẫu trong các quan sát thông qua toàn bộ giai đoạn thu thập dữ liệu (Savenye, Robinson, 2004). Hình thức phân tích được xác định theo cách tiếp cận định tính cụ thể được thực hiện (nghiên cứu thực địa, phân tích nội dung dân tộc học, lịch sử truyền miệng, tiểu sử, nghiên cứu không phô trương ) và hình thức của dữ liệu (ghi chép hiện trường, tài liệu, băng ghi âm, băng video).
Một thành phần thiết yếu của việc đảm bảo tính toàn vẹn của dữ liệu là phân tích chính xác và phù hợp các kết quả nghiên cứu. Phân tích thống kê không phù hợp làm sai lệch kết quả khoa học, đánh lừa độc giả bình thường (Shepard, 2002), và có thể ảnh hưởng tiêu cực đến nhận thức của công chúng về nghiên cứu. Các vấn đề về tính toàn vẹn cũng liên quan đến việc phân tích dữ liệu phi thống kê.
Các kỹ năng trong phân tích số liệu
Cân nhắc / vấn đề trong phân tích dữ liệu Có một số vấn đề mà các nhà nghiên cứu nên nhận thức được liên quan đến phân tích dữ liệu. Bao gồm các:
- Có các kỹ năng cần thiết để phân tích
- Lựa chọn đồng thời các phương pháp thu thập dữ liệu và phân tích thích hợp
- Rút ra suy luận không thiên vị
- Phân tích nhóm con không phù hợp
- Tuân theo các tiêu chuẩn có thể chấp nhận được đối với các kỷ luật
- Xác định ý nghĩa thống kê
- Thiếu các phép đo kết quả được xác định rõ ràng và khách quan
- Cung cấp phân tích trung thực và chính xác
- Cách trình bày dữ liệu
- Các vấn đề về môi trường / ngữ cảnh
- Phương pháp ghi dữ liệu
- Phân vùng ‘văn bản’ khi phân tích dữ liệu định tính
- Đào tạo nhân viên thực hiện phân tích
- Độ tin cậy và tính hợp lệ
- Phạm vi phân tích
Chi tiết các kỹ năng
Có các kỹ năng cần thiết để phân tích
Một giả định ngầm của các điều tra viên là họ đã được đào tạo đủ để chứng minh tiêu chuẩn cao về thực hành nghiên cứu. ‘Hành vi sai lầm khoa học’ không chủ ý có thể là kết quả của việc hướng dẫn và theo dõi không tốt. Một số nghiên cứu cho thấy đây có thể là trường hợp thường xuyên hơn người ta tin (Nowak, 1994; Silverman, Manson, 2003). Ví dụ, Sica nhận thấy rằng việc đào tạo đầy đủ các bác sĩ trong các trường y khoa trong việc thiết kế, thực hiện và đánh giá thích hợp các thử nghiệm lâm sàng là “rất nhỏ” (Sica, trích dẫn trong Nowak, 1994). Thật vậy, một khóa học về thống kê sinh học là khóa học nhiều nhất thường được cung cấp (Christopher Williams, trích dẫn trong Nowak, 1994).
Một thực tế phổ biến của các nhà điều tra là trì hoãn việc lựa chọn quy trình phân tích cho một ‘nhà thống kê’ của nhóm nghiên cứu. Về cơ bản, các nhà điều tra nên có nhiều hiểu biết cơ bản hơn là cơ sở để lựa chọn một phương pháp phân tích này hơn một phương pháp phân tích khác. Điều này có thể cho phép các nhà điều tra giám sát tốt hơn các nhân viên tiến hành quá trình phân tích dữ liệu và đưa ra các quyết định sáng suốt
Lựa chọn đồng thời các phương pháp thu thập dữ liệu và phân tích thích hợp
Mặc dù các phương pháp phân tích có thể khác nhau tùy theo chuyên ngành khoa học, nhưng giai đoạn tối ưu để xác định các quy trình phân tích thích hợp xảy ra sớm trong quá trình nghiên cứu và không phải là một suy nghĩ sau đó. Theo Smeeton và Goda (2003), “Tư vấn thống kê cần được thu thập ở giai đoạn lập kế hoạch ban đầu của một cuộc điều tra, ví dụ, phương pháp chọn mẫu và thiết kế bảng câu hỏi là phù hợp”.
Rút ra suy luận không thiên vị
Mục đích chính của phân tích là để phân biệt giữa một sự kiện xảy ra phản ánh một tác động đúng với một sự kiện sai. Bất kỳ sai lệch nào xảy ra trong việc thu thập dữ liệu hoặc lựa chọn phương pháp phân tích, sẽ làm tăng khả năng rút ra suy luận sai lệch. Sự sai lệch có thể xảy ra khi việc tuyển dụng những người tham gia nghiên cứu giảm xuống dưới số lượng tối thiểu cần thiết để chứng minh sức mạnh thống kê hoặc không duy trì đủ thời gian theo dõi cần thiết để chứng minh hiệu quả (Altman, 2001).
Phân tích nhóm con không phù hợp
Khi không chứng minh được mức độ khác nhau về mặt thống kê giữa các nhóm điều trị, điều tra viên có thể sử dụng cách chia nhỏ phân tích thành các nhóm nhỏ hơn và nhỏ hơn để tìm ra sự khác biệt. Mặc dù thực hành này có thể không phải là phi đạo đức, những phân tích này nên được đề xuất trước khi bắt đầu nghiên cứu ngay cả khi mục đích là khám phá trong tự nhiên. Nếu nghiên cứu mang tính chất khám phá, nhà điều tra nên trình bày rõ ràng điều này để độc giả hiểu rằng nghiên cứu này mang tính chất của một cuộc thám hiểm săn bắn hơn là chủ yếu dựa trên lý thuyết.
Mặc dù một nhà nghiên cứu có thể không có giả thuyết dựa trên lý thuyết để kiểm tra mối quan hệ giữa các biến chưa được kiểm tra trước đó, nhưng một lý thuyết sẽ phải được phát triển để giải thích một phát hiện không lường trước được. Thật vậy, trong khoa học khám phá, không có giả thuyết tiên nghiệm do đó không có thử nghiệm giả thuyết. Mặc dù các lý thuyết thường có thể thúc đẩy các quá trình được sử dụng trong việc điều tra các nghiên cứu định tính, nhưng nhiều khi các mẫu hành vi hoặc sự kiện xuất phát từ dữ liệu được phân tích có thể dẫn đến việc phát triển các khung lý thuyết mới hơn là xác định.tiên nghiệm (Savenye, Robinson, 2004).
Có thể hình dung rằng nhiều thử nghiệm thống kê có thể mang lại một phát hiện đáng kể do tình cờ thay vì phản ánh một hiệu quả thực sự. Tính toàn vẹn sẽ bị tổn hại nếu điều tra viên chỉ báo cáo các thử nghiệm với những phát hiện quan trọng và bỏ qua việc đề cập đến một số lượng lớn các thử nghiệm không đạt được mức quan trọng. Mặc dù việc truy cập vào các gói thống kê dựa trên máy tính có thể tạo điều kiện thuận lợi cho việc áp dụng các quy trình phân tích ngày càng phức tạp, việc sử dụng các gói này không phù hợp cũng có thể dẫn đến lạm dụng.
Đánh giá các tiêu chuẩn
Mọi lĩnh vực nghiên cứu đã phát triển các phương pháp thực hành được chấp nhận để phân tích dữ liệu. Resnik (2000) tuyên bố rằng các nhà điều tra cần thận trọng khi tuân theo các tiêu chuẩn được chấp nhận này. Resnik nói thêm rằng các định mức ‘… dựa trên hai yếu tố:
(1) bản chất của các biến được sử dụng (ví dụ: định lượng, so sánh hoặc định tính),
(2) các giả định về dân số mà từ đó dữ liệu được rút ra (tức là, phân phối ngẫu nhiên, tính độc lập, cỡ mẫu, v.v.). Nếu một người sử dụng các chuẩn mực độc đáo, điều quan trọng là phải nói rõ điều này đang được thực hiện, và cho biết phương pháp phân tích mới và có thể không được chấp nhận này đang được sử dụng như thế nào, cũng như nó khác với các phương pháp truyền thống khác như thế nào. Ví dụ, Schroder, Carey và Vanable (2003) kết hợp việc xác định các giải pháp phân tích dữ liệu mới và mạnh mẽ được phát triển để đếm dữ liệu trong lĩnh vực nguy cơ lây nhiễm HIV với cuộc thảo luận về những hạn chế của các phương pháp thường được áp dụng.
Nếu một người sử dụng các chuẩn mực độc đáo, điều quan trọng là phải nói rõ điều này đang được thực hiện và cho biết phương pháp phân tích mới và có thể không được chấp nhận này đang được sử dụng như thế nào, cũng như nó khác với các phương pháp truyền thống khác như thế nào. Ví dụ, Schroder, Carey và Vanable (2003) kết hợp việc xác định các giải pháp phân tích dữ liệu mới và mạnh mẽ được phát triển để đếm dữ liệu trong lĩnh vực nguy cơ lây nhiễm HIV với cuộc thảo luận về những hạn chế của các phương pháp thường được áp dụng.
Xác định ý nghĩa
Trong khi thực hành thông thường là thiết lập một tiêu chuẩn có thể chấp nhận được đối với ý nghĩa thống kê, với một số nguyên tắc nhất định, cũng có thể thích hợp để thảo luận xem việc đạt được ý nghĩa thống kê có ý nghĩa thực tế thực sự hay không, tức là ‘ý nghĩa lâm sàng’. Jeans (1992) định nghĩa ‘ý nghĩa lâm sàng’ là “tiềm năng cho các phát hiện nghiên cứu để tạo ra sự khác biệt thực sự và quan trọng đối với khách hàng hoặc thực hành lâm sàng, tình trạng sức khỏe hoặc bất kỳ vấn đề nào khác được xác định là ưu tiên liên quan cho ngành học”.
Kendall và Grove (1988) định nghĩa ý nghĩa lâm sàng về điều gì sẽ xảy ra khi “… những khách hàng rối loạn và rối loạn bây giờ, sau khi điều trị, không thể phân biệt được với nhóm tham chiếu có ý nghĩa và đại diện không bị rối loạn”. Thompson và Noferi (2002) gợi ý rằng độc giả của tài liệu tư vấn nên mong đợi các tác giả báo cáo các chỉ số ý nghĩa thực tế hoặc lâm sàng, hoặc cả hai, trong báo cáo nghiên cứu của họ. Shepard (2003) đặt câu hỏi tại sao một số tác giả không chỉ ra rằng mức độ của những thay đổi quan sát được có thể quá nhỏ để có bất kỳ ý nghĩa lâm sàng hoặc thực tế nào, “đôi khi, một thay đổi được cho là có thể được mô tả chi tiết, nhưng điều tra viên không tiết lộ rằng xu hướng không có ý nghĩa thống kê ”.
Thiếu các phép đo kết quả được xác định rõ ràng và khách quan
Không có lượng phân tích thống kê nào, bất kể mức độ phức tạp, sẽ sửa chữa các phép đo kết quả khách quan được xác định kém. Cho dù được thực hiện không chủ ý hay do thiết kế, thực hành này làm tăng khả năng che giấu việc giải thích các phát hiện, do đó có khả năng gây hiểu lầm cho người đọc.
Cung cấp phân tích trung thực và chính xác
Cơ sở cho vấn đề này là tính cấp thiết của việc giảm khả năng xảy ra sai sót thống kê. Những thách thức phổ biến bao gồm loại trừ các ngoại lệ , điền vào dữ liệu bị thiếu, thay đổi hoặc thay đổi dữ liệu, khai thác dữ liệu và phát triển các biểu diễn đồ họa của dữ liệu (Shamoo, Resnik, 2003).
Cách trình bày dữ liệu
Đôi khi, các nhà điều tra có thể nâng cao ấn tượng về một phát hiện quan trọng bằng cách xác định cách trình bày dữ liệu thu được (trái ngược với dữ liệu ở dạng thô), phần nào của dữ liệu được hiển thị, tại sao, như thế nào và cho ai (Shamoo, Resnik, 2003) . Nowak (1994) lưu ý rằng ngay cả các chuyên gia cũng không đồng ý trong việc phân biệt giữa phân tích và xoa bóp dữ liệu. Shamoo (1989) khuyến nghị rằng các nhà điều tra nên duy trì một dấu vết giấy tờ đầy đủ và chính xác về cách dữ liệu được thao tác để xem xét trong tương lai.
Các vấn đề về môi trường / ngữ cảnh
Tính toàn vẹn của phân tích dữ liệu có thể bị ảnh hưởng bởi môi trường hoặc bối cảnh mà dữ liệu được thu thập, tức là phỏng vấn trực tiếp so với nhóm tập trung. Sự tương tác xảy ra trong một mối quan hệ khó hiểu (người phỏng vấn-người được phỏng vấn) khác với sự tương tác của nhóm xảy ra trong một nhóm tập trung vì số lượng người tham gia và cách họ phản ứng với các câu trả lời của nhau. Vì quá trình thu thập dữ liệu có thể bị ảnh hưởng bởi môi trường / bối cảnh, các nhà nghiên cứu nên tính đến điều này khi tiến hành phân tích dữ liệu.
Phương pháp ghi dữ liệu
Các phân tích cũng có thể bị ảnh hưởng bởi phương pháp ghi dữ liệu. Ví dụ: các sự kiện nghiên cứu có thể được ghi lại bằng:
một. ghi âm thanh và / hoặc video và phiên âm sau đó
b. hoặc một nhà nghiên cứu hoặc một cuộc khảo sát tự quản lý
c. hoặc là khảo sát đã kết thúc đóng hoặc khảo sát đã kết thúc mở
d. chuẩn bị ghi chú thực địa dân tộc học từ một người tham gia / quan sát
e. yêu cầu người tham gia tự ghi chép, biên soạn và gửi cho các nhà nghiên cứu.
Mặc dù mỗi phương pháp luận được sử dụng đều có cơ sở lý luận và ưu điểm, các vấn đề về tính khách quan và chủ quan có thể được đặt ra khi dữ liệu được phân tích.
Phân vùng văn bản
Trong quá trình phân tích nội dung, nhân viên nghiên cứu hoặc ‘người đánh giá’ có thể sử dụng các chiến lược không nhất quán trong việc phân tích tài liệu văn bản. Một số ‘người đánh giá’ có thể phân tích tổng thể các nhận xét trong khi những người khác có thể thích phân tích nội dung văn bản bằng cách tách các từ, cụm từ, mệnh đề, câu hoặc nhóm câu. Mọi nỗ lực cần được thực hiện để giảm hoặc loại bỏ sự mâu thuẫn giữa các “người xếp hạng” để tính toàn vẹn của dữ liệu không bị ảnh hưởng.
Đào tạo nhân viên thực hiện phân tích
Một thách thức lớn đối với tính toàn vẹn của dữ liệu có thể xảy ra với sự giám sát không được kiểm soát của các kỹ thuật quy nạp. Phân tích nội dung yêu cầu người đánh giá chỉ định chủ đề cho tài liệu văn bản (nhận xét). Mối đe dọa đối với tính liêm chính có thể phát sinh khi những người đánh giá đã được đào tạo không nhất quán, hoặc có thể đã nhận được (các) kinh nghiệm đào tạo trước đó. Kinh nghiệm trước đây có thể ảnh hưởng đến cách người đánh giá cảm nhận tài liệu hoặc thậm chí nhận thức bản chất của các phân tích sẽ được tiến hành. Vì vậy, một người xếp hạng có thể chỉ định các chủ đề hoặc mã cho tài liệu khác biệt đáng kể với một người xếp hạng khác. Các chiến lược để giải quyết vấn đề này sẽ bao gồm việc nêu rõ danh sách các quy trình phân tích trong sổ tay giao thức, đào tạo nhất quán và giám sát thường xuyên những người đánh giá.
Độ tin cậy và tính xác thực Các nhà nghiên cứu thực hiện phân tích cả phân tích định lượng hoặc định tính nên nhận thức được những thách thức đối với độ tin cậy và tính hợp lệ. Ví dụ, trong lĩnh vực phân tích nội dung, Gottschalk (1995) xác định ba yếu tố có thể ảnh hưởng đến độ tin cậy của dữ liệu được phân tích:
- tính ổn định hoặc xu hướng người viết mã liên tục mã lại cùng một dữ liệu theo cùng một cách trong một khoảng thời gian
- khả năng tái tạo, hoặc xu hướng một nhóm lập trình viên phân loại thành viên các danh mục theo cùng một cách
- độ chính xác, hoặc mức độ phân loại văn bản tương ứng với tiêu chuẩn hoặc quy chuẩn về mặt thống kê
Khả năng ảnh hưởng đến tính toàn vẹn của dữ liệu phát sinh khi các nhà nghiên cứu không thể chứng minh một cách nhất quán tính ổn định, khả năng tái tạo hoặc độ chính xác của phân tích dữ liệu
Theo Gottschalk, (1995), tính hợp lệ của một nghiên cứu phân tích nội dung đề cập đến sự tương ứng của các danh mục (phân loại mà người phê duyệt được gán cho nội dung văn bản) với các kết luận và tính tổng quát của kết quả đối với một lý thuyết (các danh mục có hỗ trợ kết luận của nghiên cứu, và phát hiện có đủ mạnh để hỗ trợ hoặc áp dụng cho một cơ sở lý thuyết đã chọn không?).
Phạm vi phân tích số liệu
Khi mã hóa tài liệu văn bản để phân tích nội dung, người đánh giá phải phân loại mỗi mã thành một hạng mục thích hợp của ma trận tham chiếu chéo. Việc dựa vào phần mềm máy tính để xác định tần suất hoặc số lượng từ có thể dẫn đến sự không chính xác. “Người ta có thể đếm chính xác sự xuất hiện và tần suất của từ đó, nhưng không tính toán được chính xác ý nghĩa vốn có trong từng cách sử dụng cụ thể” (Gottschalk, 1995). Các phân tích sâu hơn có thể thích hợp để khám phá chiều của tập dữ liệu hoặc xác định các biến cơ bản có ý nghĩa mới.
Cho dù các phương pháp phân tích thống kê hay phi thống kê được sử dụng, các nhà nghiên cứu nên nhận thức được khả năng ảnh hưởng đến tính toàn vẹn của dữ liệu. Trong khi phân tích thống kê thường được thực hiện trên dữ liệu định lượng, có rất nhiều quy trình phân tích được thiết kế đặc biệt cho tài liệu định tính bao gồm phân tích nội dung, chuyên đề và dân tộc học. Bất kể một người nghiên cứu các hiện tượng định lượng hay định tính, các nhà nghiên cứu sử dụng nhiều công cụ khác nhau để phân tích dữ liệu nhằm kiểm tra các giả thuyết, các mô hình hành vi và cuối cùng là trả lời các câu hỏi nghiên cứu. Việc không hiểu hoặc không thừa nhận các vấn đề phân tích dữ liệu được trình bày có thể ảnh hưởng đến tính toàn vẹn của dữ liệu.