Results 1 to 2 of 2

Thread: "Xoa bóp dữ liệu" và sự nghiệp của một giáo sư

  1. #1
    thanhtam's Avatar
    thanhtam is offline Sinh viên Y4
    Giấy phép số
    NT-32
    Cấp phép ngày
    Jul 2012
    Bệnh nhân
    157
    Cám ơn
    22
    Được cám ơn
    190/82
    Kinh nghiệm khám
    25

    Default "Xoa bóp dữ liệu" và sự nghiệp của một giáo sư

    "Xoa bóp dữ liệu" và sự nghiệp của một giáo sư marketing
    GS Nguyễn Văn Tuấn

    Ngành tâm lí học Hà Lan xem ra không may mắn. Liên tục hai vụ vi phạm đạo đức khoa học liên quan đến hai giáo sư khả kính bị phơi bày trước ánh sáng khoa học. Vụ thứ nhất là Diederik Alexander Stapel giả tạo dữ liệu nghiên cứu. Nay đến vụ liên quan đến giáo sư Dirk Smeesters, nhưng ông này không giả tạo mà là xoa bóp dữ liệu (dân khoa học gọi là data massage). Vụ việc được một nhà khoa học Mĩ dùng phương pháp thống kê để phát hiện.

    Nghiên cứu khoa học thực nghiệm thường được tiến hành theo những trình tự căn bản: giả thuyết, thu thập dữ liệu, phân tích, và công bố. Bất cứ công đoạn nào cũng có thể vi phạm đạo đức khoa học. Ở khâu thu thập dữ liệu, nhà khoa học hay phụ tá có thể ghi chép dữ liệu không đúng hay theo ý mình. Ví dụ như thay vì đo huyết áp của bệnh nhân, người thu thập lười biếng chỉ hỏi sơ qua rồi ghi vào hồ sơ. Ở khâu phân tích dữ liệu, nhà nghiên cứu có thể chỉnh sửa dữ liệu theo ý mình, có thể làm rất nhiều phân tích theo kiểu câu cá (fishing expedition) để có kết quả có ý nghĩa thống kê (statistical significance). Một trong những sai phạm rất phổ biến, nhưng ít bắt được, là loại bỏ những dữ liệu không theo giả thuyết của nhà khoa học. Đó cũng là hình thức tra tấn dữ liệu (data torture). Dữ liệu không có ý nghĩa, nhưng bị nhà khoa học tra tấn mãi, dữ liệu cũng “khai” là có ý nghĩa. Một hình thức ngược với tra tấn dữ liệu là data massage, tức xoa nắn dữ liệu cho đến khi nó có ý nghĩa thống kê.

    Đó là trường hợp Dirk Smeesters, giáo sư tâm lí học thuộc Đại học Erasmus (Hà Lan) và là một chuyên gia về marketing. Gs Smeesters cũng là một người có tiếng trong chuyên ngành tâm lí xã hội học, nhưng có lẽ ở đẳng cấp thấp hơn Diederik Stapel. Nhìn vào danh sách công trình và chất lượng thì ông có lẽ thuộc vào nhóm giáo sư trung bình. Sự việc xuất phát từ công trình “The effect of color (red versus blue) on assimilation versus contrast in prime-to-behavior effects” công bố trên Journal of Experimental Psychology năm 2011, mà trong đó có một số dữ liệu có thể xem là đáng nghi ngờ. Ngoài ra, một bài khác cũng có vấn đề và phải rút lại đăng trên Journal of Personality and Social Psychology năm 2012. Cả hai công trình có nhiều số liệu được xem là “too good to be true”.

    Khi hai công trình trên được công bố, một nhà tâm lí học người Mĩ tên là Uri Simonsohn phân tích lại dữ liệu và kết quả cho thấy những trị số P báo cáo trong bài báo rất đáng ngờ. Simonsohn liên lạc với Smeesters để hỏi phương pháp nghiên cứu ông làm ra sao. Smeesters hoàn toàn hợp tác, và thậm chí còn gửi cả số liệu cho Simonsohn phân tích lại. Simonsohn công bố phương pháp phân tích trên một tập san tâm lí học. Phương pháp của Simonsohn rất đơn giản. Ông giả định rằng với những độ lệch chuẩn được báo cáo trong bài báo, chắc chắn phải có một sự dao động về số trung bình giữa các nhóm trong cùng điều kiện thí nghiệm. Do đó, nếu lấy mẫu nhiều lần, thì có thể đoán được mức độ dao động của các số trung bình. Nếu độ dao động của số trung bình quá thấp thì đó là điều đáng nghi ngờ. Phương pháp này đòi hỏi một vài mô phỏng, nhưng với máy tính hiện đại thì vấn đề này không khó thực hiện. Bằng cách lí giải và phương pháp trên, Simonsohn đi đến kết luận rằng kết quả của Smeesters có thể là những kết quả có “chọn lọc”.

    Khi Simonsohn nêu vấn đề thì chính Smeesters chủ động liên lạc hội đồng khoa bảng Đại học Erasmus để giải quyết nghi vấn. Hội đồng khoa bảng Đại học Erasmus vừa tham vấn một giáo sư về thống kê học của Erasmus, vừa liên lạc với Simonsohn để tìm hiểu thêm về cách phân tích của ông. Sau một thời gian thảo luận và thẩm định, phương pháp của Simonsohn được xem là hợp lí.

    Đại học Erasmus lập một ủy ban điều tra (gọi là Committee for Inquiry into Scientific Integrity - CISI) để xem xét tất cả các công trình nghiên cứu của Smeesters. Trong tất cả 29 công trình mà Smeesters đã công bố hay đang được bình duyệt, CSIS yêu cầu Smeesters cho biết ai là đồng tác giả, ai là người thực hiện thí nghiệm, ai là người phân tích dữ liệu, và ai là người quản lí dữ liệu. Smeesters rất hợp tác trong điều tra, và ông khẳng định không có chuyện phịa dữ liệu. Nhưng khi áp dụng phương pháp của Simonsohn trên 22 công trình nghiên cứu mà Smeesters làm từ lúc được bổ nhiệm ở Erasmus, và với sai sót loại I là 5% (alpha level), có thể kì vọng 1.1 biến phụ thuộc với trị số P liên kết (P joint value) dưới 5%. Nhưng trong thực tế thì có đến 6 biến phụ thuộc với P liên kết thấp hơn 5%, và điều này cho thấy độ dao động quá thấp (đáng nghi ngờ).

    Khi bị chất vấn với những kết quả trên, Smeesters thú nhận là ông có “xoa bóp” dữ liệu. Ông cho biết trong 3 công trình nghiên cứu, ông loại trừ những đối tượng không tuân thủ hay không có khả năng đáp ứng điều kiện thí nghiệm. Khi được hỏi tại sao ông loại trừ những đối tượng như thế, ông cho biết là làm như thế để tăng độ ảnh hưởng và do đó trị số P trở nên “significant” (tức là có ý nghĩa thống kê). Kết quả có ý nghĩa thống kê thì xác suất được công bố mới cao. Ông gọi đó là “blue dot technique” mà nhiều người trong giới khoa học xã hội và tâm lí học sử dụng. Tuy nhiên, cách ông mô tả còn được gọi là data massage – xoa bóp dữ liệu. Trong khoa học thực nghiệm có nhiều trường hợp dữ liệu không trơn tru như nhiều người tưởng, và không ít nhà khoa học cố tình xoa bóp cho đến khi dữ liệu trơn tru hơn trước khi phân tích. Nhưng dĩ nhiên, đó là phương pháp không được cộng đồng khoa học chấp nhận, vì không thể loại bỏ dữ liệu chỉ vì chúng không nằm trong sự kì vọng của nhà khoa học.

    Ngoài vấn đề xoa bóp dữ liệu ra, CSIS còn ghi nhận một số bất bình thường trong quá trình nghiên cứu của Gs Smeesters. Những vấn đề này bao gồm:

    + Ông tự mình thu thập dữ liệu, xử lí dữ liệu, phân tích dữ liệu, mà không có sự kiểm soát từ đồng nghiệp khác. Trong bộ môn của ông làm việc cũng không có hệ thống kiểm soát và bình duyệt;
    + Ông không lưu giữ dữ liệu gốc (raw data) trên giấy hay trong máy tính;
    + Phương pháp phân tích thống kê có nhiều vấn đề, nhất là các số trung bình trong các thí nghiệm gần giống nhau đến bất thường;
    + Một số công trình mà sự phân bố của dữ liệu gần như không thể có trong thực tế.

    Tháng 6 vừa qua, sau khi điều tra sự việc, Gs Smeesters đệ đơn xin từ chức. Hội đồng Đại học Erasmus chấp thuận đề nghị của Smeesters. Thế là sự nghiệp của một nhà khoa học phải đến hồi kết thúc một cách buồn bã.

    Sự việc còn nói lên một "bệnh" trong khoa học: quá lệ thuộc vào trị số P. Vì đại đa số các nhà khoa học đặt mục tiêu P < 0.05 như là một chuẩn vàng để có kết quả đáng chú ý, đáng công bố, nên trị số này trở nên mục tiêu cho lạm dụng. Không ít nhà khoa học lặng lẻ sửa đổi hay xoa bóp dữ liệu cho đến khi họ có P < 0.05. Nhưng trị số P rất dễ bị hiểu lầm là nó phản ảnh xác suất của giả thuyết vô hiệu (null hypothesis). Thật ra, trị số P không phản ảnh xác suất của giả thuyết vô hiệu. Chỉ có phương pháp Bayes mới cho phép nhà khoa học phát biểu về xác suất của giả thuyết vô hiệu. Sự việc này một lần nữa nói lên rằng đã đến lúc khoa học chuyển sang phương pháp suy luận Bayes thay vì lệ thuộc vào phương pháp cổ điển (trị số P).

    Nhìn người lại nghĩ đến … Việt Nam. Có lẽ nhiều bạn đọc sẽ mỉm cười khi đọc bài này, vì dù không ai nêu ra, nhưng xoa bóp dữ liệu có lẽ khá phổ biến ở Việt Nam. Một số trường hợp do không hiểu qui ước khoa học (tức vi phạm vô ý thức), nhưng không ít trường hợp tác giả cố ý để có dữ liệu tròn trĩnh và đạt ý nghĩa thống kê. Ngoài ra, môi trường khoa học Việt Nam cũng thiếu hệ thống bình duyệt nghiêm chỉnh, và nhiều người làm việc một cách độc lập mà không cộng tác với đồng nghiệp nên gây ra nhiều nghi ngờ về sự chính xác của dữ liệu. Quá trình giải quyết vấn đề của Đại học Erasmus phải nói là đáng kính nể. Họ xem vấn đề data massage rất nghiêm trọng, nên lập hẳn một ủy ban chuyên môn để điều tra và giải quyết. Ở Việt Nam thì chắc chẳng ai quan tâm đến chuyện nguỵ tạo dữ liệu, chứ nói gì đến chuyện xoa bóp dữ liệu. Nhưng câu chuyện liên quan Smeesters và cách giải quyết của Erasmus cũng có thể xem là một kinh nghiệm, một cơ hội để các đại học và trung tâm nghiên cứu ở Việt Nam chấn chỉnh lại qui trình nghiên cứu khoa học cho thật sự nghiêm chỉnh.


  2. The Following User Says Thank You to thanhtam For This Useful Post:

    drchinh (06-08-12)

  3. #2
    hungtmh's Avatar
    hungtmh is offline Sinh viên Y1
    Giấy phép số
    NT-1338
    Cấp phép ngày
    Dec 2012
    Bệnh nhân
    9
    Cám ơn
    0
    Được cám ơn
    6/4
    Kinh nghiệm khám
    0

    Default

    Ối giời ơi, Thầy Tuấn ơi, thầy đừng có mà cởi truồng bảo vệ thiên nhiên nhé. Thật hổ thẹn cho các cụ rùa Văn miếu, năm nào cũng phải im lặng ngắm đít của các nhà khoa học TS, PGS, GS, TSKH, toàn những tên trộm cắp mạo danh. Nếu massage dữ kiện đã bị soi thì các gs, pgs, ts tskh của ta phải đem ra moi gan rút ruột vì họ sáng tạo ra kết quả( vì bịa hết nghiên cứu từ đầu đến cuối để rút tiền ngân sách), chép sách( thuê dịch sách nước ngoài và chép lại không sai 1 dấu phẩy), không đọc hết công trình nghiên cứu của họ 1 lần(vì thuê viết), không có kiến thức sơ đẳng về chuyên ngành họ bảo vệ luận văn, hay hướng dẫn bảo vệ luận văn(vì bảo kê tên tuổi cho ncs chuyên ngành khác)... Thầy ơi, thầy nổi tiếng là người nghiên cứu yêu khoa học, hãy dành thời gian còn lại của đời mình ( không còn nhiều đâu) chăm lo nền khoa học 1 chiều, đừng phí hoài công sức lay chuyển một đám sình bùn nhơ nhớp mà các nhà khoa học Việt nam đang ngụp lặn tranh dành. Nếu Thầy biết hiện nay có nghề đi chấm luận văn thì thầy có ngạc nhiên không? Thầy có biết giá cho qua của 1 ncs là bao nhiêu không? Thầy có biết là có chủ tịch hội đồng không phân biệt được móc giải phẫu cơ bản không? Thầy ơi, chúng em biết sinh nhầm thời, chúng em biết khoa học của thầy không hợp vói thân phận của chúng em nhưng chúng em xin hứa vói thầy là chúng em luôn hướng về ngọn lửa thầy thắp lên, mong nhận đươc chỉ dạy của thầy. Kính mong đại xá cho những lời ngang ngược nhưng tự đáy lòng của một học trò của thầy.


LinkBacks (?)

  1. 14-01-13, 23:56

Thread Information

Users Browsing this Thread

Hiện có 1 bác đang thực tập trong bệnh phòng này. (0 học viên và 1 dự thính)

Similar Threads

  1. Bệnh nhân: 1
    Last Post: 05-11-15, 18:01
  2. [CNTT] Liệu Google có giữ vững được "Ngôi Vương"?
    By Dean.Winchester in forum CÔNG NGHỆ THÔNG TIN
    Bệnh nhân: 3
    Last Post: 08-07-15, 19:50
  3. Bệnh nhân: 3
    Last Post: 22-08-13, 07:52

Bookmarks

Quyền viết bài

  • Bác không được phép tạo bài mới
  • Bác không được phép trả lời bài
  • Bác không được đính kèm file vào bài viết
  • Bác không được sửa lại bài mình viết
  •