Chúc mừng nhóm sinh viên lớp CTTT2020 có bài báo tại Hội nghị Khoa học Quốc tế RIVF năm 2024
Hội nghị RIVF là một hội nghị quốc tế Công nghệ Truyền thông và Điện toán, là sự kiện khoa học quốc tế lớn quy tụ các nhà khoa học, nghiên cứu trong lĩnh vực điện toán và truyền thông ở Việt Nam và thế giới đồng hành “Nghiên cứu – Đổi mới và Tầm nhìn cho tương lai” (Research, Innovation and Vision for the future, viết tắt là RIVF). Hội nghị RIVF được liệt kê vào danh sách các hội nghị uy tín theo đề xuất của SCOPUS and ISI Web of Science. RIVF đã trải qua 17 lần tổ chức và lần thứ 18 được tổ chức vào tháng 12/2024, tại thành phố Đà Nẵng, Việt Nam.
Link hội nghị: https://rivf2024.duytan.edu.vn/
Tên bài báo: “LawViVQA: A Visual Question Answering Dataset for Vietnamese Legal Content”
Nhóm sinh viên thực hiện:
- 20521331, Lê Quang Hoà, CTTT2020
- 20521381, Kiều Xuân Diệu Hương, CTTT2020
Giảng viên hướng dẫn: TS. Nguyễn Thanh Bình, KS. Trần Vĩnh Khiêm
Abstract:
Sự gia tăng về mức độ phức tạp và số lượng của các văn bản pháp lý đòi hỏi sự phát triển của những giải pháp hiệu quả trong việc quản lý thông tin. Trong bối cảnh đó, Hỏi Đáp trực quan (VQA) cho thấy tiềm năng trong việc giải quyết thách thức này, nhưng việc áp dụng VQA cho các văn bản pháp lý lại gặp phải những khó khăn đặc thù do ngôn ngữ và ngữ cảnh phức tạp của các tài liệu này. Để hỗ trợ nghiên cứu trong lĩnh vực này, chúng em giới thiệu LawViVQA, một bộ dữ liệu được thiết kế đặc biệt cho việc hỏi đáp dựa trên hình ảnh (VQA) trong lĩnh vực pháp lý. LawViVQA bao gồm 5.200 hình ảnh tài liệu pháp lý tiếng cùng với 23.000 cặp câu hỏi – câu trả lời tương ứng. Bộ dữ liệu này giúp mở rộng nghiên cứu về VQA, đồng thời giải quyết những thách thức đặc thù trong việc diễn giải tài liệu pháp lý. Chúng em cũng đã tiến hành đánh giá các phương pháp nền tảng, từ mạng nơ-ron cơ bản đến các kỹ thuật VQA nâng cao như Scene Text VQA và Xử Lý Ngôn Ngữ Tự Nhiên (NLP), nhằm hiểu rõ hơn hiệu quả của các phương pháp này trong môi trường pháp lý.
Mặc dù LawViVQA cung cấp một nền tảng nghiên cứu cho bài toán VQA trong lĩnh vực pháp lý, nghiên cứu vẫn gặp phải những hạn chế. Đặc biệt, số lượng câu hỏi thực tế và độ phức tạp của các câu hỏi trong bộ dữ liệu còn tương đối hạn chế, chưa phản ánh đầy đủ các tình huống thực tế thường gặp trong lĩnh vực pháp lý, nơi các câu hỏi thường có ngữ cảnh phức tạp và đòi hỏi sự hiểu biết sâu về pháp luật.
“Chúng em xin được gửi lời cảm ơn đến Khoa Hệ Thống Thông Tin và Phòng Thí Nghiệm UIT ISLAB đã tạo điều kiện cho chúng em hoàn thành nghiên cứu.
Chúng em xin gửi lời cảm ơn đến Thầy Nguyễn Thanh Bình, Thầy Trần Vĩnh Khiêm đã đồng hành cùng nhóm chúng em trong quá trình nghiên cứu và công bố bài báo khoa học quốc tế.”