Dữ liệu lớn trong hoạt động văn hóa, nghệ thuật ở Việt Nam

Dữ liệu lớn (big data) là thuật ngữ được sử dụng để mô tả khối lượng lớn và phức tạp của dữ liệu được tạo ra từ nhiều nguồn khác nhau. Dữ liệu lớn được đánh giá bằng các thuật toán máy tính để tìm ra các mô hình và thông tin hữu ích từ đó. Ngoài ra, dữ liệu lớn cũng bao gồm các công nghệ, khoa học dữ liệu và những công cụ phân tích giúp các tổ chức trích xuất kiến thức từ ý nghĩa của dữ liệu và tìm ra giải pháp cho các vấn đề của họ. Các nguồn dữ liệu lớn gồm có trang web, thiết bị di động, cảm biến IoT, máy móc và các hệ thống của tổ chức. Các ứng dụng của dữ liệu lớn được sử dụng trong nhiều lĩnh vực như y tế, tài chính, sản xuất, bán lẻ, giáo dục, nhân sự... thu được thỏa mãn mới nhất của các chuyên gia về dữ liệu lớn là tránh các lỗi hệ thống phân tích có thể dẫn đến kết quả sai lệch hoặc ảnh hưởng đến quyết định của người dùng. Dữ liệu lớn là nhân tố quan trọng thúc đẩy kết nối thế giới số với thế giới thực, tạo nền tảng cho internet kết nối vạn vật (IoT). Chính vì thế, phân tích dữ liệu lớn hữu ích cho hoạt động phân tích, tính toán và dự báo cho các hoạt động kinh tế, xã hội, trong đó có cả lĩnh vực văn hóa, nghệ thuật (VHNT). Trong bối cảnh cách mạng công nghiệp 4.0 đang nhận được nhiều sự quan tâm của cả thế giới, việc xem xét ứng dụng dữ liệu lớn trở thành một phần không thể thiếu trong hoạt động VHNT.

1. Dữ liệu lớn trong hoạt động phát triển khán giả

Dữ liệu lớn có tầm quan trọng rất lớn trong hoạt động phát triển khán giả bởi nó cung cấp cho các tổ chức, doanh nghiệp và các nhà sản xuất nghệ thuật thông tin quan trọng về khách hàng và thị trường. Thông qua việc phân tích dữ liệu, các tổ chức có thể tìm ra thói quen mua sắm, sở thích và nhu cầu của khán giả, từ đó thiết kế các chương trình giải trí, đồng hành cùng khán giả và phát triển các sản phẩm mới phù hợp với thị hiếu của khán giả. Nó giúp các công ty và tổ chức nghệ thuật đưa ra quyết định đúng đắn trong việc tổ chức sự kiện nghệ thuật, quảng cáo, tiếp thị và marketing. Dữ liệu lớn cũng cung cấp cho các tổ chức thông tin về độ tuổi, giới tính, địa phương và các thông tin khác về khán giả, từ đó giúp họ đưa ra chiến lược kinh doanh và xây dựng hình ảnh thương hiệu phù hợp với đối tượng khán giả mục tiêu.

Một trong những đặc trưng cơ bản của dữ liệu lớn là lượng thông tin đồ sộ của người sử dụng. Do đặc điểm của xã hội hiện nay, thông tin cá nhân có thể được thu thập từ nhiều nguồn, nếu sử dụng cho mục đích kinh doanh sẽ tạo ra lợi thế không nhỏ đối với các doanh nghiệp, trong đó có cả các đơn vị nghệ thuật.

Một trong những điểm yếu căn bản của thị trường VHNT ở Việt Nam hiện nay là họ ít hoặc không nắm bắt được đối tượng khách hàng của mình là ai. Vì việc thiếu thông tin khiến cho việc kinh doanh nghệ thuật hiệu quả yếu, lãng phí nguồn lực marketing. Sự khủng hoảng của Cambridge Anatical trong việc tiết lộ thông tin 50 triệu người dùng Facebook, có khả năng ảnh hưởng đến kết quả bầu cử ở Mỹ, cho thấy sức mạnh của thông tin cá nhân. Thậm chí, trong xã hội ngày nay, nhiều người cho rằng dữ liệu cá nhân chính là nguồn tài nguyên quan trọng nhất, hơn tất cả các nguồn tài nguyên khác hiện có. Bản chất của vụ việc này có một khía cạnh tích cực: nếu chúng ta nắm được thông tin của người sử dụng dịch vụ (giới tính, sở thích, thói quen, địa bàn sinh sống...), chúng ta có cơ hội kinh doanh thành công, trong đó không loại trừ lĩnh vực VHNT.

Thực ra, không phải đợi đến khi thuật ngữ dữ liệu lớn ra đời và được áp dụng thì thông tin khán giả mới trở nên quan trọng đối với việc kinh doanh trong lĩnh vực VHNT. Trên thực tế, trong hoạt động marketing, việc thu thập dữ liệu người dùng/ khán giả đã được thực hiện từ khá sớm. Ví dụ, những điều tra xã hội học đã chỉ ra rằng, khán giả xem phim chiếu rạp ở Việt Nam đa phần là thanh niên, sống ở đô thị, đặc biệt là ở TP.HCM. Những thông tin cơ bản này giúp chúng ta định hướng sản xuất ra những bộ phim ăn khách dành cho khán giả trẻ, sống ở đô thị, đặc biệt là chú ý đến thị hiếu của khán giả TP.HCM. Đó là một trong những yếu tố khiến cho bộ phim có doanh thu cao.

Vấn đề ở đây, dữ liệu lớn có thể giúp chúng ta tối đa hóa những thông tin như vậy. Xây dựng và khai thác dữ liệu lớn mang lại nhiều cơ hội kinh doanh trong lĩnh vực VHNT. Các công ty và tổ chức đang đầu tư rất nhiều vào việc thu thập và phân tích dữ liệu để có thể hiểu rõ hơn về thói quen mua sắm, sở thích, nhu cầu của khách hàng. Một ví dụ cho thấy: “Hãng AT&T của Mỹ nhận ra rằng, trong trung tâm chăm sóc khách hàng của họ có rất nhiều dữ liệu phức tạp, liên quan đến nhiều sự vụ, vấn đề khác nhau. Hãng này đã sử dụng dữ liệu lớn để phân loại những dữ liệu này thành những nhóm khác nhau, từ đó tìm ra cách thức chung giải quyết cho những vấn đề tương đối giống nhau. Việc đơn giản hóa vấn đề cuối cùng không chỉ mang lại kết quả tốt trong việc giải quyết các vấn đề phát sinh đó mà còn làm cho hệ thống cũng được thay đổi tốt hơn, gắn bó hơn” (1). Như vậy, rõ ràng rằng, khi chúng ta tập hợp được thông tin về khán giả, phân tích được thói quen, thị hiếu, những đặc điểm nhân khẩu cũng như những vấn đề bức xúc của họ thì dữ liệu lớn cung cấp cho chúng ta những giải pháp để xử lý thông tin từ khán giả một cách hữu hiệu hơn, giống như cách một công ty giải trí của Mỹ (Caesars Entertainment), sau khi xác định được vấn đề bức xúc, đã làm hài lòng khán giả trung thành của công ty qua việc giảm thời gian chờ đợi của họ. Hay “Công ty Netflix sử dụng dữ liệu từ việc lựa chọn chương trình truyền hình của khách hàng để phân tích và tìm xem công ty nên phát triển chương trình truyền hình nào thì sẽ thu hút được khán giả” (2). Hoặc Amazon sử dụng dữ liệu lớn để đề xuất và tùy chỉnh các sản phẩm cho khách hàng cá nhân; Spotify sử dụng dữ liệu lớn để đề xuất các bài hát và playlist phù hợp với sở thích nghe nhạc của người dùng.

Việc sử dụng dữ liệu lớn trong hoạt động phát triển khán giả không chỉ giúp doanh nghiệp hiểu rõ hơn về khách hàng, mà còn giúp tăng hiệu quả và tính cạnh tranh trong hoạt động kinh doanh. Tuy nhiên, việc này cũng cần phải tuân thủ các quy định về quyền riêng tư của người dùng và bảo mật thông tin cá nhân. Để làm được điều này, các đơn vị VHNT cần có một hoạt động dành riêng cho việc thu thập thông tin khán giả đối với mỗi sự kiện. Những thông tin này được sắp xếp thành hệ thống, có sự cập nhật và liên hệ thường xuyên để tạo thành khán giả trung thành cho đơn vị VHNT. Kết nối gần gũi hơn với khán giả sẽ giúp cho hoạt động kinh doanh trở nên tốt hơn.

Gần đây, việc Việt Nam có sàn giao dịch trực tuyến các tác phẩm nghệ thuật do Indochina Art khởi xướng là một hướng đi để hình thành dữ liệu lớn, nhằm phát triển khán giả theo cách này. Đây là mô hình tiên phong trong cách kinh doanh nghệ thuật ở Việt Nam dựa trên cách thức các nghệ sĩ có tài khoản giao dịch và mã số riêng trên mạng, họ trưng bày các tác phẩm nghệ thuật của mình để kết nối với nhau và kết nối với thị trường, mọi hình thức kinh doanh đều tuân thủ luật kinh doanh thương mại điện tử. Bên cạnh đó, các đơn vị VHNT cũng cần có cách thức riêng để chia sẻ thông tin về khán giả, tạo điều kiện hỗ trợ nhau phát triển. Lôgic ở đây là, khán giả nghệ thuật thường có xu hướng ảnh hưởng qua lại với nhau. Những người thích xem phim cũng có xu hướng thích nghe nhạc; hay những người thích nghe nhạc cũng có xu hướng thích đến các triển lãm nghệ thuật. Việc tạo điều kiện cho khán giả yêu thích một loại hình nghệ thuật sẽ là cơ hội để khán giả yêu thích các loại hình nghệ thuật khác.

Như vậy, về cơ bản, để sử dụng dữ liệu lớn trong hoạt động phát triển khán giả, chúng ta cần: 1) Thu thập dữ liệu: Các tổ chức nên thu thập dữ liệu từ nhiều nguồn khác nhau, từ các tài khoản mạng xã hội của khách hàng đến các hồ sơ mua hàng và các khảo sát; 2) Phân tích dữ liệu: Dữ liệu lớn cung cấp cho các tổ chức rất nhiều thông tin. Để sử dụng hiệu quả dữ liệu, tổ chức nên phân tích dữ liệu để tìm ra các xu hướng, thói quen và nhu cầu của khách hàng; 3) Tạo kế hoạch phát triển khán giả: Dữ liệu phân tích cung cấp cơ sở cho các tổ chức tạo ra kế hoạch phát triển khán giả bằng cách thiết kế các sản phẩm mới hoặc cải tiến sản phẩm hiện có để đáp ứng nhu cầu của khách hàng; 4) Xây dựng chiến lược quảng cáo: Các tổ chức có thể sử dụng dữ liệu lớn để xây dựng chiến lược quảng cáo hướng đến đối tượng khán giả khác nhau; 5) Tăng cường trải nghiệm khách hàng: Dữ liệu lớn cung cấp cho các tổ chức thông tin về thói quen, sở thích và nhu cầu của khách hàng. Điều này giúp các tổ chức tạo ra các trải nghiệm độc đáo và phù hợp với khách hàng của mình; 6) Tối ưu hóa chi phí quảng cáo: Dữ liệu lớn cung cấp thông tin về thị trường và khách hàng, giúp các tổ chức tối ưu hóa chi phí quảng cáo và tiết kiệm chi phí trong hoạt động quảng cáo.

2. Dữ liệu lớn trong hoạt động đào tạo VHNT

Trong cuộc cách mạng công nghiệp 4.0, nhiều ngành nghề truyền thống sẽ bị ảnh hưởng bởi robot, trí tuệ nhân tạo và thiết bị thông minh. Các lĩnh vực ngành nghề VHNT cũng không nằm ngoài quy luật chung này. Chính vì vậy, hoạt động đào tạo cần có những thay đổi để thích nghi và tận dụng ưu thế của cuộc cách mạng 4.0 nhằm tạo ra nguồn nhân lực cao cho quá trình phát triển bền vững đất nước.

Việc sử dụng dữ liệu lớn trong hoạt động đào tạo VHNT có nhiều ý nghĩa quan trọng trong việc cải thiện chất lượng đào tạo. Dữ liệu lớn giúp giảng viên và những người đứng đầu các nhà trường hiểu rõ hơn về nhu cầu và mong muốn của sinh viên, từ đó thiết kế các khóa học và chương trình đào tạo phù hợp với mục tiêu của sinh viên. Đồng thời, tối ưu hóa quản lý đào tạo, ở đó, dữ liệu lớn có thể giúp quản lý đào tạo dễ dàng hơn trong việc phân tích các hoạt động của sinh viên, đưa ra các biện pháp để cải thiện chất lượng và hiệu suất của các khóa học, chương trình đào tạo; hỗ trợ cho việc hướng nghiệp, theo đó, dữ liệu lớn có thể giúp sinh viên tìm kiếm và lựa chọn các nghề nghiệp phù hợp với sở thích, năng lực và mục tiêu của họ. Cuối cùng, dữ liệu lớn có thể giúp nhà trường tối ưu hóa việc quản lý, giảng dạy và đánh giá sinh viên, từ đó giảm thiểu thời gian và chi phí.

Trên thế giới, việc sử dụng dữ liệu lớn trong hoạt động đào tạo VHNT đang rất phổ biến và được nhiều nước đầu tư và phát triển. Ví dụ, tại Mỹ, các trường đại học lớn như Stanford, MIT, Harvard đã sử dụng dữ liệu lớn để thiết kế các khóa học trực tuyến phục vụ cho sinh viên trên toàn thế giới. Ngoài ra, họ còn sử dụng dữ liệu lớn để phân tích, đánh giá và cải thiện chất lượng đào tạo. Tại châu Âu, dữ liệu lớn cũng được áp dụng vào hoạt động giảng dạy. Ở Đức và Pháp, các trường đại học sử dụng dữ liệu lớn để quản lý và giám sát các khóa học trực tuyến, hỗ trợ và giám sát thông tin sinh viên, giúp họ nâng cao hiệu quả học tập. Tại châu Á, những quốc gia như Nhật Bản, Hàn Quốc, Trung Quốc cũng đang đẩy mạnh việc sử dụng dữ liệu lớn trong đào tạo VHNT. Có thể thấy rằng, việc sử dụng dữ liệu lớn trong hoạt động đào tạo VHNT đang trở thành xu hướng và được áp dụng rộng rãi trên toàn thế giới.

Với các trường VHNT, ngoài ứng dụng in 3D mà cuộc cách mạng công nghiệp 4.0 mang lại để tạo các sản phẩm mẫu và thiết kế, dữ liệu lớn là một ứng dụng nữa tạo thuận lợi cho hoạt động đào tạo VHNT. “Nguồn dữ liệu để các trường học sử dụng ngày càng nhiều, đặc biệt là khi hình thức học từ xa hoặc cách thức trao đổi thông tin giữa người dạy và người học được thực hiện qua công nghệ thông tin tiên tiến. Mục đích của việc sử dụng dữ liệu cũng rất phong phú như thu hút sinh viên, lập kế hoạch chương trình học tập, lựa chọn chuyên ngành hoặc môn học, đánh giá kết quả học tập, cải thiện khả năng học tập…” (3).

Hiện nay, các trường VHNT đang đối mặt với nhiều khó khăn trong quá trình tuyển sinh. Một trong những lý do căn bản của tình trạng này là do học sinh không hiểu rõ về ngành nghề được đào tạo. Việc cung cấp một trang web tương tác giữa trường VHNT với học sinh/ sinh viên để họ hiểu rõ hơn về trường, ngành học, đồng thời tương tác với nhà trường trực tiếp sẽ giúp cho các cơ sở đào tạo VHNT nắm rõ hơn nhu cầu, nguyện vọng của học sinh/ sinh viên, từ đó có những cách thức đáp ứng tốt hơn các nhu cầu và nguyện vọng này, có thể thu hút thêm nhiều học sinh/ sinh viên cũng như cải thiện tốt hơn chất lượng đào tạo của mình. Ở Mỹ, Công ty Capture Hinger Ed cung cấp phần mềm cho hơn 50 trường học tìm hiểu về thói quen trên mạng của sinh viên, từ đó, cho phép các trường có những kế hoạch thu hút, phục vụ sinh viên tốt hơn.

Học tập trực tuyến là một hình thức đào tạo ngày càng phát triển trong bối cảnh ứng dụng dữ liệu lớn. Hình thức học tập này là sự thay đổi đáng kể so với cách thức học tập truyền thống. Nhờ có dữ liệu lớn, sinh viên có thể tự lựa chọn chương trình và thời gian học để hoàn thành số lượng tín chỉ. Các cơ sở đào tạo cần phải thích nghi với hình thức đào tạo trực tuyến để có thể thu hút nhiều hơn sinh viên, bảo đảm cho sự tồn tại của mình, đồng thời tạo ra một tầng lớp xã hội quan tâm và yêu mến VHNT. Để làm được điều đó, các trường cần đầu tư tốt hơn cho cơ sở hạ tầng thông tin của mình với một trang web mang tính tương tác cao, nhiều dữ liệu để tra cứu thông tin, có thể trả lời và tư vấn trực tuyến.

Nâng cao chất lượng đào tạo cũng là một mục tiêu quan trọng trong đào tạo VHNT. Một trong những vấn đề đang đặt ra đối với hoạt động đào tạo hiện nay là tình trạng đạo văn. Đạo văn không chỉ là một vấn đề nghiêm trọng về đạo đức khoa học mà còn ảnh hưởng xấu đến thói quen của học sinh/ sinh viên. Để hạn chế tình trạng này, nhiều trường đã sử dụng các phần mềm chống đạo văn để xử lý các luận văn, luận án và các công trình nghiên cứu khoa học khác. Tuy nhiên, các phần mềm này sẽ không phát huy tác dụng nếu các cơ sở đào tạo VHNT không sử dụng dữ liệu lớn. Điều này có nghĩa là, các cơ sở đào tạo VHNT cần có sự liên kết với nhau, tạo ra một cơ sở dữ liệu các luận văn, luận án, công trình nghiên cứu khoa học của mình, từ đó, các phần mềm đạo văn có thể so sánh các văn bản để xác định mức độ đạo văn của các công trình khoa học.

Bên cạnh đó, dữ liệu lớn sẽ là vô ích nếu nó không gắn với những tài năng sáng tạo. Các cơ sở đào tạo VHNT chính là nơi xuất phát cho những tài năng sáng tạo này. Khi các tài năng sáng tạo được kết nối với kho dữ liệu lớn, việc ứng dụng để tạo ra sản phẩm VHNT cho các ngành công nghiệp văn hóa trở nên thuận tiện hơn. Chẳng hạn, một sinh viên mỹ thuật có thể sáng tác dựa trên những hiểu biết của mình về nghệ thuật truyền thống của dân tộc. Những nghệ thuật truyền thống của dân tộc này và cả những sáng tạo liên quan đến chúng được lưu trữ trên hệ thống cơ sở dữ liệu của cơ sở đào tạo. Kết hợp với các công nghệ mới như thiết kế và in 3D, những sáng tạo của sinh viên mỹ thuật sẽ nhanh chóng được hiện thực hóa hơn.

Không chỉ trong tuyển sinh đầu vào và triển khai đào tạo, dữ liệu lớn cũng có thể giúp các trường VHNT kết nối tốt hơn với các cựu sinh viên của mình. Việc tạo ra liên kết với các cựu sinh viên không chỉ khẳng định thương hiệu của cơ sở đào tạo VHNT, mà còn là cơ hội để các trường hiểu rõ hơn về nguyện vọng, nhu cầu của các cựu sinh viên, từ đó có cách thức hoàn thiện hơn quá trình đào tạo.

Để việc sử dụng dữ liệu lớn trong hoạt động đào tạo VHNT có thể mang lại nhiều lợi ích cho các tổ chức giáo dục và sinh viên, chúng ta cần quan tâm đến một số vấn đề: 1) Thiết kế và cải thiện chương trình đào tạo: Các trường đại học và tổ chức giáo dục có thể sử dụng dữ liệu lớn để phân tích và đánh giá chất lượng đào tạo hiện tại, từ đó có thể thiết kế và cải thiện chương trình đào tạo để đáp ứng nhu cầu của sinh viên và thị trường lao động; 2) Điều chỉnh phương pháp đào tạo: Dữ liệu lớn có thể giúp các tổ chức giáo dục xác định phương pháp đào tạo phù hợp với từng cá nhân để tối đa hóa hiệu quả học tập. Ví dụ, họ có thể sử dụng dữ liệu để lập các kế hoạch học tập cá nhân và tư vấn cho sinh viên về cách học tốt hơn; 3) Sử dụng từ vựng và phát âm chuẩn: Dữ liệu lớn có thể giúp các sinh viên học ngoại ngữ sử dụng từ vựng và phát âm chuẩn hơn. Các tổ chức giáo dục có thể sử dụng các công nghệ dữ liệu lớn để phát triển các ứng dụng điện thoại thông minh, tương tác người máy và các công cụ khác giúp cho sinh viên học tiếng Anh tốt hơn; 4) Điều tra và nghiên cứu: Các tổ chức giáo dục có thể sử dụng dữ liệu lớn để tiến hành các nghiên cứu về VHNT, hệ thống giáo dục, và các vấn đề xoay quanh đó. Các nghiên cứu này có thể giúp cho các chính sách và chiến lược phát triển được hoàn thiện hơn; 5) Truyền thông và tiếp cận: Dữ liệu lớn có thể giúp các tổ chức giáo dục tiếp cận được đến các đối tượng học tập trên toàn thế giới, đặc biệt là những đối tượng có điều kiện khó khăn, họ khó tiếp cận được giáo dục chất lượng. Thông qua các trang mạng xã hội hoặc các kênh truyền thông khác, các tổ chức có thể truyền tải đến toàn thế giới các khóa học VHNT để sinh viên có thể tiếp cận và học tập với chất lượng cao mà không cần phải đến trực tiếp trường học.

___________________

1, 2, 3. Trần Thị Vân Hoa (chủ biên), Cách mạng công nghiệp 4.0: Vấn đề đặt ra cho phát triển kinh tế - xã hội và hội nhập quốc tế của Việt Nam (sách chuyên khảo), Nxb Chính trị quốc gia Sự thật, 2017, tr.86-87, 89, 91.

Tài liệu tham khảo

1. Fabio Schreiber, Flora Amato, F Colace, Massimo de Santo, Vincenzo Moscato, Antonio Picariello, Letizia Tanca, Big data meets digital cultural heritage: Design and implementation of SCRABS, a smart context-aware browsing assistant for cultural environments (Dữ liệu lớn đáp ứng di sản văn hóa kỹ thuật số: Thiết kế và triển khai SCRABS, trợ lý duyệt ngữ cảnh thông minh cho môi trường văn hóa), Journal on Computing and Cultural Heritage (Tạp chí Điện toán và Di sản văn hóa), 2017.

2. Big data for good, odbms.org, 5-6-2012.

PGS, TS BÙI HOÀI SƠN

Nguồn: Tạp chí VHNT số 539, tháng 7-2023

;