25/05/2018, 17:58
Ngôn ngữ từ khóa
Khái niệm Ngôn ngữ từ khoá là ngôn ngữ tư liệu kết hợp, sau được sử dụng để mô tả nội dung tài liệu và tìm tin theo nội dung. Từ khoá là đơn vị từ vựng đủ nghĩa và ổn định, phản ánh các vấn đề đặc trưng cho nội dung tài liệu, được chọn ra nhằm mục đích tìm tài liệu đó theo yêu cầu thông ...
Khái niệm
Ngôn ngữ từ khoá là ngôn ngữ tư liệu kết hợp, sau được sử dụng để mô tả nội dung tài liệu và tìm tin theo nội dung.
Từ khoá là đơn vị từ vựng đủ nghĩa và ổn định, phản ánh các vấn đề đặc trưng cho nội dung tài liệu, được chọn ra nhằm mục đích tìm tài liệu đó theo yêu cầu thông tin.
Theo tiêu chuẩn TCVN 5453-91: "Từ khoá là từ hoặc cụm từ rút ra từ tài liệu hoặc yêu cầu tin và mang ý nghĩa chủ đạo xét trên quan điểm tìm tin (có giá trị tìm tin)".
Tập hợp từ khoá phản ánh nội dung tài liệu gọi là mẫu tìm tài liệu. Mẫu tìm tài liệu đại diện cho tài liệu trong việc tìm tin, được lưu giữ trong CSDL.
Ví dụ: Tài liệu “Kỹ thuật chăn nuôi gia cầm” được xác định tập hợp từ khoá (mẫu tìm) là: Gia cầm, gà, vịt, ngan, ngỗng, chăn nuôi.
Từ khóa có các chức năng:
+ Thông tin: Tập hợp các từ khoá (được rút ra từ tài liệu ) có khả năng phản ánh nội dung của tài liệu, do vậy có tác dụng thông báo (tới người dùng tin) về nội dung tài liệu gốc.
+ Tìm tin: Mỗi từ khoá tạo nên một điểm tiếp cận thông tin, có tác dụng tìm tài liệu. Khi truy cập CSDL, người dùng tin có thể sử dụng một hoặc một số từ khóa để tìm tài liệu/thông tin theo yêu cầu tìm tin đặt ra.
Các loại từ khoá
- Theo từ loại, có các loại từ khoá sau:
+ Danh từ: Gồm danh từ chung (chỉ người, chỉ vật) và danh từ riêng (chỉ người, chỉ địa danh hành chính, phi hành chính)
+ Động từ (đã được danh từ hoá): ăn mòn, bảo quản, xử lý, tiêu chuẩn hoá
+ Danh từ kết hợp với danh từ: Giao thông đường thuỷ, cấu trúc nguyên tử
+ Danh từ kết hợp với tính từ: Phát triển bền vững, an toàn thực phẩm, gốm chịu lửa
+ Danh từ kết hợp với động từ (đã được danh từ hoá): Đập ngăn nước, thiết bị ép
+ Động từ (đã danh từ hoá)+ danh từ: Bảo vệ môi trường, bảo quản thuỷ sản, dệt vải, mạ bạc
+ Danh từ kết hợp với số từ: Thế kỷ 20
+ Cụm từ phức đã được dùng ổn định, nếu tách sẽ làm biến nghĩa: nước đang phát triển, thượng tầng kiến trúc, tư tưởng Hồ Chí Minh, phong trào cộng sản và công nhân.
- Căn cứ vào nội dung của từ khoá (nội dung mà thông tin từ khoá phản ánh).
+ Tên gọi các ngành, các bộ môn KH, lĩnh vực hoạt động cụ thể
+ Tên gọi chung và riêng của người, nhóm người, tên sinh vật, nhóm sinh vật
+ Tên gọi đồ vật, sự vật (tên gọi chung và tên gọi riêng): Chung cư; Chung cư A
+ Tên gọi của cơ quan, tổ chức, địa danh: UNESCO
+ Tên gọi các ngôn ngữ, dân tộc
+ Tên gọi/ từ chỉ các hiện tượng tự nhiên, xã hội: mưa, lụt, thất nghiệp...
+ Chỉ các sự kiện, giai đoạn lịch sử: Cách mạng Tháng 10 Nga, Triều Lê...
+ Chỉ tính chất của sự vật, hiện tượng, quá trình: độ bền, độ chính xác...
+ Chỉ phương pháp, quy trình tiến hành, hoạt động: Phương pháp đo, phương pháp thử, thiết kế, đóng gói.
- Căn cứ vào góc độ phản ảnh nội dung tài liệu gốc:
+ Từ khoá chủ đề (từ khoá đối tượng): Chỉ đối tượng nghiên cứu của tài liệu
Đối tượng nghiên cứu của tài liệu bao gồm:
-) Đối tượng bậc 1: Đối tượng trực tiếp được nghiên cứu trong nội dung của tài liệu: "Chăn nuôi gà"
-) Đối tượng bậc 2: Là đối tượng có liên quan tới đối tượng bậc 1, có thể là đối tượng khác của đối tượng bậc 1 hoặc là thành phần của đối tượng bậc 1: "Chăn nuôi gà ở hộ gia đình"
+ Từ khoá phương diện: Là từ khoá chỉ phương diện nghiên cứu của đối tượng bao gồm:
-) Phương diện nội dung: Chế biến, sửa chữa...
-) Phương diện thời gian: Thế kỷ 19, Giai đoạn 1954 – 1975…
-) Phương diện địa điểm: Châu Á, Tây Nguyên…
-) Hình thức của tài liệu: Giáo trình...
- Căn cứ vào mức độ phản ánh nội dung (vai trò của từ khoa đối với nội dung của TL).
+ Từ khoá chính: Là từ khoá phản ánh đối tượng nghiên cứu của tài liệu
+ Từ khoá phụ: là từ khoá phản ảnh phương diện nghiên cứu, được sử dụng để làm rõ nghĩa cho từ khoá chính
Ngôn ngữ từ khoá là ngôn ngữ tư liệu kết hợp, sau được sử dụng để mô tả nội dung tài liệu và tìm tin theo nội dung.
Từ khoá là đơn vị từ vựng đủ nghĩa và ổn định, phản ánh các vấn đề đặc trưng cho nội dung tài liệu, được chọn ra nhằm mục đích tìm tài liệu đó theo yêu cầu thông tin.
Theo tiêu chuẩn TCVN 5453-91: "Từ khoá là từ hoặc cụm từ rút ra từ tài liệu hoặc yêu cầu tin và mang ý nghĩa chủ đạo xét trên quan điểm tìm tin (có giá trị tìm tin)".
Tập hợp từ khoá phản ánh nội dung tài liệu gọi là mẫu tìm tài liệu. Mẫu tìm tài liệu đại diện cho tài liệu trong việc tìm tin, được lưu giữ trong CSDL.
Ví dụ: Tài liệu “Kỹ thuật chăn nuôi gia cầm” được xác định tập hợp từ khoá (mẫu tìm) là: Gia cầm, gà, vịt, ngan, ngỗng, chăn nuôi.
Từ khóa có các chức năng:
+ Thông tin: Tập hợp các từ khoá (được rút ra từ tài liệu ) có khả năng phản ánh nội dung của tài liệu, do vậy có tác dụng thông báo (tới người dùng tin) về nội dung tài liệu gốc.
+ Tìm tin: Mỗi từ khoá tạo nên một điểm tiếp cận thông tin, có tác dụng tìm tài liệu. Khi truy cập CSDL, người dùng tin có thể sử dụng một hoặc một số từ khóa để tìm tài liệu/thông tin theo yêu cầu tìm tin đặt ra.
Các loại từ khoá
- Theo từ loại, có các loại từ khoá sau:
+ Danh từ: Gồm danh từ chung (chỉ người, chỉ vật) và danh từ riêng (chỉ người, chỉ địa danh hành chính, phi hành chính)
+ Động từ (đã được danh từ hoá): ăn mòn, bảo quản, xử lý, tiêu chuẩn hoá
+ Danh từ kết hợp với danh từ: Giao thông đường thuỷ, cấu trúc nguyên tử
+ Danh từ kết hợp với tính từ: Phát triển bền vững, an toàn thực phẩm, gốm chịu lửa
+ Danh từ kết hợp với động từ (đã được danh từ hoá): Đập ngăn nước, thiết bị ép
+ Động từ (đã danh từ hoá)+ danh từ: Bảo vệ môi trường, bảo quản thuỷ sản, dệt vải, mạ bạc
+ Danh từ kết hợp với số từ: Thế kỷ 20
+ Cụm từ phức đã được dùng ổn định, nếu tách sẽ làm biến nghĩa: nước đang phát triển, thượng tầng kiến trúc, tư tưởng Hồ Chí Minh, phong trào cộng sản và công nhân.
- Căn cứ vào nội dung của từ khoá (nội dung mà thông tin từ khoá phản ánh).
+ Tên gọi các ngành, các bộ môn KH, lĩnh vực hoạt động cụ thể
+ Tên gọi chung và riêng của người, nhóm người, tên sinh vật, nhóm sinh vật
+ Tên gọi đồ vật, sự vật (tên gọi chung và tên gọi riêng): Chung cư; Chung cư A
+ Tên gọi của cơ quan, tổ chức, địa danh: UNESCO
+ Tên gọi các ngôn ngữ, dân tộc
+ Tên gọi/ từ chỉ các hiện tượng tự nhiên, xã hội: mưa, lụt, thất nghiệp...
+ Chỉ các sự kiện, giai đoạn lịch sử: Cách mạng Tháng 10 Nga, Triều Lê...
+ Chỉ tính chất của sự vật, hiện tượng, quá trình: độ bền, độ chính xác...
+ Chỉ phương pháp, quy trình tiến hành, hoạt động: Phương pháp đo, phương pháp thử, thiết kế, đóng gói.
- Căn cứ vào góc độ phản ảnh nội dung tài liệu gốc:
+ Từ khoá chủ đề (từ khoá đối tượng): Chỉ đối tượng nghiên cứu của tài liệu
Đối tượng nghiên cứu của tài liệu bao gồm:
-) Đối tượng bậc 1: Đối tượng trực tiếp được nghiên cứu trong nội dung của tài liệu: "Chăn nuôi gà"
-) Đối tượng bậc 2: Là đối tượng có liên quan tới đối tượng bậc 1, có thể là đối tượng khác của đối tượng bậc 1 hoặc là thành phần của đối tượng bậc 1: "Chăn nuôi gà ở hộ gia đình"
+ Từ khoá phương diện: Là từ khoá chỉ phương diện nghiên cứu của đối tượng bao gồm:
-) Phương diện nội dung: Chế biến, sửa chữa...
-) Phương diện thời gian: Thế kỷ 19, Giai đoạn 1954 – 1975…
-) Phương diện địa điểm: Châu Á, Tây Nguyên…
-) Hình thức của tài liệu: Giáo trình...
- Căn cứ vào mức độ phản ánh nội dung (vai trò của từ khoa đối với nội dung của TL).
+ Từ khoá chính: Là từ khoá phản ánh đối tượng nghiên cứu của tài liệu
+ Từ khoá phụ: là từ khoá phản ảnh phương diện nghiên cứu, được sử dụng để làm rõ nghĩa cho từ khoá chính
- Căn cứ vào mức độ kiểm soát từ vựng:
+ Từ khoá tự do: Do người định từ khoá đưa ra.
+ Từ khoá kiểm soát: Các bộ từ khoá quy ước, từ điển từ khoá, từ điển từ chuẩn.
Yêu cầu đối với từ khoá
Từ khóa dùng để xử lý nội dung tài liệu phải đảm bảo các yêu cầu sau:
Thông dụng, khoa học: Từ khoá phải là những thuật ngữ khoa học trong các lĩnh vực thuộc đề tài của tài liệu.
Để đảm bảo yêu cầu này, khi định từ khóa không dùng từ địa phương, từ có nghĩa bóng.
Súc tích: Thuật ngữ sử dụng làm từ khoá phải hàm chứa nội dung thông tin nhiều nhất trong hình thức ngắn gọn nhất (với số lượng ký tự ít nhất có thể).
Để đảm bảo yêu cầu về tính súc tích của từ khóa, có thể thực hiện các biện pháp sau:
- Giảm bỏ hư từ nếu có thể:
+ Từ chỉ sự danh từ hoá: sự phát triển è phát triển
sự ăn mòn è ăn mòn
+ Những từ chỉ số nhiều: Những, các, một vài
+ Giới từ, liên từ (một số): Trong, của...
- Một số thực từ (từ có chứa thông tin) trong trường hợp không có tác dụng với thuật ngữ mô tả khái niệm (không làm rõ nghĩa của từ) cũng có thể lược bỏ:
Bệnh ung thư è Ung thư
Cán bộ nhà nước è Cán bộ
Cây lúa è Lúa
Bệnh AIDS è AIDS
Tuyến đường sắt è Đường sắt
- Có thể sử dụng từ Hán - Việt nếu từ đó thông dụng:
Dụng cụ đo nhiệt è Nhiệt kế
Ngắn gọn: từ khoá phải ngắn gọn.
Có thể sử dụng biện pháp tách từ để đảm bảo tính ngắn gọn của từ khóa nhưng không được làm thay đổi ý nghĩa của từ sau khi tách từ. Có thể tách từ theo hai cách:
- Tách từ theo cú pháp: Áp dụng biện pháp tách ttheo cú pháp đối với những cụm từ có cấu trúc sau:
+ Hoạt động hướng ngoại đi đôi với đối tượng của hành động:
Khai thác tài nguyên è Khai thác % tài nguyên
Sản xuất ô tô è Sản xuất % ô tô
Sản xuất thép è SX % thép
Quản lý xí nghiệp è Quản lý % xí nghiệp
+ Hành động hướng nội+ Chủ thể của hành động:
Lão hoá bê tông è Lão hoá % bê tông
Suy thoái môi trường è Suy thoái % môi trường
Bạc màu đất è Bạc màu % đất
+ Cụm từ chỉ đối tượng và tính chất của đối tượng:
Độ chua của đất è ĐỘ chua % đất
+ Cụm từ chỉ bộ phận của chủ thể + Chủ thể
Động cơ ô tô è Động cơ % ô tô
Rễ ngô è Rễ % ngô
+ Chỉ tiêu, thông số:
Hàm lượng thuốc trừ sâu è Hàm lượng % thuốc trừ sâu
Chất lượng đào tạo è Chất lượng % đào tạo
Sản lượng lúa è Sản lượng % lúa
- Tách theo ngữ nghĩa: Tách cụm từ thành những phần tử có nghĩa rồi ghép các phần tử đó với nhau để tạo ra những thuật ngữ ngắn hơn cụm từ gốc:
Thép các bon bền nhiệt è Thép các bon % Thép bền nhiệt
Giống ngô ngắn ngày è Giống ngô % Giống ngắn ngày
Mạ bạc hồ quang è Mạ bạc % Mạ hồ quang
Chụp ảnh nghệ thuật è Chụp ảnh % Ảnh nghệ thuật
Phân vùng kinh tế è Phân vùng% Vùng kinh tế
Tập thể dục nhịp điệu è Tập thể dục% Thể dục nhịp điệu
Tuy nhiên, không nên tách khi:
+ Cùm từ đã được dùng ổn định trong thực tế: Hoa quả; kế hoạch hóa gia đình…
+ Là tên gọi các lĩnh vực hoạt động, ngành, chuyên ngành: Chế tạo máy,
Dự báo thuỷ văn; Địa vật lý; Mỹ thuật công nghiệp; Thông tin – thư viện; Mô tả tài liệu; Bảo vệ môi trường; Bảo hộ lao động; Chuyển giao công nghệ…
+ Việc tách sẽ làm thay đổi ý nghĩa của cụm từ: Di sản văn hoá; Di tích lịch sử, Thượng tầng kiến trúc; Bê tông cốt thép; Chất độc màu da cam; Điện thoại di động...
+ Cụm từ chỉ tên định luật, định lý, phương pháp: Định luật Ôm, Định lý Ta-let...
+ Tên gọi các đối tượng là máy móc, thiết bị, thuốc, vật liệu đi kèm: Máy sao chụp; Thiết bị ép; Thiết bị làm lạnh; Thiết bị nghe nhìn...
+ Các thuật ngữ phái sinh từ thuật ngữ gốc:
Kinh tế: Kinh tế cá thể
Kinh tế nhà nước
Kinh tế hợp doanh
Thị trường: Thị trường chứng khoán
Thị trường tiền tệ
Thông tin: Thông tin cổ động
Thông tin đại chúng
Đơn nghĩa: Từ khoá phải là từ đơn nghĩa (1 thuật ngữ chỉ một khái niệm)
- Xử lý từ đồng nghĩa: Chọn từ thông dụng nhất làm từ khoá, nếu là định từ khóa tự do.
Hoặc làm theo chỉ dẫn của phương tiện kiểm soát từ, là từ định từ khóa có kiểm soát
Phóng viên = Nhà báo è Nhà báo
Nhân quyền = Quyền con người è Nhân quyền
- Xử lý từ đa nghĩa: Căn cứ vào nội dung của tài liệu để cụ thể hoá thuật ngữ chỉ đối tượng
Ví dụ: (cái) đinh và (cây gỗ) đinh
Hoặc không dùng “dầu” chung chung mà cần xác định rõ: Dầu ăn, dầu lửa, dầu thực vật, dầu bôi trơn...
Riêng đối với tên người, tên cơ quan, tổ chức và địa danh cần xây dựng bảng tra để sử dụng cho thống nhất.
Tính thuật ngữ: Từ khoá khác thuật ngữ nhưng cần có tính thuật ngữ. Đó là tính thông dụng, dễ dùng, có phong cách khoa học và được các ngành khoa học chấp nhận, phù hợp với cách ước định về ngôn ngữ trong các ngành khoa học.
VD: Tai hoạ thiên nhiên è Thiên tai
Súc vật nuôi è Gia súc
Bò để giết mổ è Bò thịt
Bò để lấy sữa è Bò sữa
Thuyết Mac- Lênin è Học thuyết Mác – Lê nin
Thuyết hệ thống è Lý thuyết hệ thống
Hệ thống sinh thái è Hệ sinh thái
Tính hiện đại: Sử dụng thuật ngữ hiện hành mà không dùng cách cũ.
Worksheet Tờ công tác è Phiếu nhập tin, phiếu tiền máy
Miêu tả tài liệu è Mô tả tài liệu
Tính khách quan: Từ khoá phải dễ hiểu, không mang tính đánh giá, không phụ thuộc vào nội dung của tài liệu khi tách chúng ra khỏi nội dung tài liệu:
Thảm hoạ è Tai hoạ
Thảm họa thiên nhiên è Thiên tai
Nếp sống văn minh è Nếp sống
Tuy nhiên, có một số từ, cụm từ mang tính chất đánh giá, đã trở thành thuật ngữ thì phải chấp nhận. Ví dụ:
Công nghiệp nặng - Công nghiệp nhẹ
Phát triển bền vững (Phát triển có chú trọng môi trường)
Nông nghiệp sạch
Kim loại đen - Kim loại màu
Hình thức của từ khoá: Khi trình bày từ khóa, phải lưu ý về:
- Chính tả:
+ Dấu thanh: Việc thả dấu thanh mặc dù không ảnh hưởng tới việc đọc một từ nào đó nhưng khi tìm tin trong CSDL lại cho kết quả tìm khác nhau (“thủy” và “thuỷ”)
+ i và y: Tương tự như việc thả dấu thanh trong tiếng Việt, khi trình bày từ khóa phải thống nhất dùng chữ “i” hay “y” ở một số từ (“kỹ sư” và “kĩ sư”, “vật lý” và “vật lí”…)
- Dấu ngăn cách giữa các từ khoá: %, ;
Trên đây là vài nét khái quát về ngôn ngữ từ khóa. Khi tiến hành định từ khóa, người cán bộ thông tin ngoài việc nắm vững kỹ năng định từ khóa còn cần phải nắm vững các yêu cầu đối với từ khóa, cũng như các biện pháp để đảm bảo các yêu cầu đó để xác định chính xác (những) từ khóa cho từng tài liệu hoặc yêu cầu tin cụ thể.
Bài: Phạm Thị Thành Tâm - Khoa Thư viện Thông tin
+ Từ khoá kiểm soát: Các bộ từ khoá quy ước, từ điển từ khoá, từ điển từ chuẩn.
Yêu cầu đối với từ khoá
Từ khóa dùng để xử lý nội dung tài liệu phải đảm bảo các yêu cầu sau:
Thông dụng, khoa học: Từ khoá phải là những thuật ngữ khoa học trong các lĩnh vực thuộc đề tài của tài liệu.
Để đảm bảo yêu cầu này, khi định từ khóa không dùng từ địa phương, từ có nghĩa bóng.
Súc tích: Thuật ngữ sử dụng làm từ khoá phải hàm chứa nội dung thông tin nhiều nhất trong hình thức ngắn gọn nhất (với số lượng ký tự ít nhất có thể).
Để đảm bảo yêu cầu về tính súc tích của từ khóa, có thể thực hiện các biện pháp sau:
- Giảm bỏ hư từ nếu có thể:
+ Từ chỉ sự danh từ hoá: sự phát triển è phát triển
sự ăn mòn è ăn mòn
+ Những từ chỉ số nhiều: Những, các, một vài
+ Giới từ, liên từ (một số): Trong, của...
- Một số thực từ (từ có chứa thông tin) trong trường hợp không có tác dụng với thuật ngữ mô tả khái niệm (không làm rõ nghĩa của từ) cũng có thể lược bỏ:
Bệnh ung thư è Ung thư
Cán bộ nhà nước è Cán bộ
Cây lúa è Lúa
Bệnh AIDS è AIDS
Tuyến đường sắt è Đường sắt
- Có thể sử dụng từ Hán - Việt nếu từ đó thông dụng:
Dụng cụ đo nhiệt è Nhiệt kế
Ngắn gọn: từ khoá phải ngắn gọn.
Có thể sử dụng biện pháp tách từ để đảm bảo tính ngắn gọn của từ khóa nhưng không được làm thay đổi ý nghĩa của từ sau khi tách từ. Có thể tách từ theo hai cách:
- Tách từ theo cú pháp: Áp dụng biện pháp tách ttheo cú pháp đối với những cụm từ có cấu trúc sau:
+ Hoạt động hướng ngoại đi đôi với đối tượng của hành động:
Khai thác tài nguyên è Khai thác % tài nguyên
Sản xuất ô tô è Sản xuất % ô tô
Sản xuất thép è SX % thép
Quản lý xí nghiệp è Quản lý % xí nghiệp
+ Hành động hướng nội+ Chủ thể của hành động:
Lão hoá bê tông è Lão hoá % bê tông
Suy thoái môi trường è Suy thoái % môi trường
Bạc màu đất è Bạc màu % đất
+ Cụm từ chỉ đối tượng và tính chất của đối tượng:
Độ chua của đất è ĐỘ chua % đất
+ Cụm từ chỉ bộ phận của chủ thể + Chủ thể
Động cơ ô tô è Động cơ % ô tô
Rễ ngô è Rễ % ngô
+ Chỉ tiêu, thông số:
Hàm lượng thuốc trừ sâu è Hàm lượng % thuốc trừ sâu
Chất lượng đào tạo è Chất lượng % đào tạo
Sản lượng lúa è Sản lượng % lúa
- Tách theo ngữ nghĩa: Tách cụm từ thành những phần tử có nghĩa rồi ghép các phần tử đó với nhau để tạo ra những thuật ngữ ngắn hơn cụm từ gốc:
Thép các bon bền nhiệt è Thép các bon % Thép bền nhiệt
Giống ngô ngắn ngày è Giống ngô % Giống ngắn ngày
Mạ bạc hồ quang è Mạ bạc % Mạ hồ quang
Chụp ảnh nghệ thuật è Chụp ảnh % Ảnh nghệ thuật
Phân vùng kinh tế è Phân vùng% Vùng kinh tế
Tập thể dục nhịp điệu è Tập thể dục% Thể dục nhịp điệu
Tuy nhiên, không nên tách khi:
+ Cùm từ đã được dùng ổn định trong thực tế: Hoa quả; kế hoạch hóa gia đình…
+ Là tên gọi các lĩnh vực hoạt động, ngành, chuyên ngành: Chế tạo máy,
Dự báo thuỷ văn; Địa vật lý; Mỹ thuật công nghiệp; Thông tin – thư viện; Mô tả tài liệu; Bảo vệ môi trường; Bảo hộ lao động; Chuyển giao công nghệ…
+ Việc tách sẽ làm thay đổi ý nghĩa của cụm từ: Di sản văn hoá; Di tích lịch sử, Thượng tầng kiến trúc; Bê tông cốt thép; Chất độc màu da cam; Điện thoại di động...
+ Cụm từ chỉ tên định luật, định lý, phương pháp: Định luật Ôm, Định lý Ta-let...
+ Tên gọi các đối tượng là máy móc, thiết bị, thuốc, vật liệu đi kèm: Máy sao chụp; Thiết bị ép; Thiết bị làm lạnh; Thiết bị nghe nhìn...
+ Các thuật ngữ phái sinh từ thuật ngữ gốc:
Kinh tế: Kinh tế cá thể
Kinh tế nhà nước
Kinh tế hợp doanh
Thị trường: Thị trường chứng khoán
Thị trường tiền tệ
Thông tin: Thông tin cổ động
Thông tin đại chúng
Đơn nghĩa: Từ khoá phải là từ đơn nghĩa (1 thuật ngữ chỉ một khái niệm)
- Xử lý từ đồng nghĩa: Chọn từ thông dụng nhất làm từ khoá, nếu là định từ khóa tự do.
Hoặc làm theo chỉ dẫn của phương tiện kiểm soát từ, là từ định từ khóa có kiểm soát
Phóng viên = Nhà báo è Nhà báo
Nhân quyền = Quyền con người è Nhân quyền
- Xử lý từ đa nghĩa: Căn cứ vào nội dung của tài liệu để cụ thể hoá thuật ngữ chỉ đối tượng
Ví dụ: (cái) đinh và (cây gỗ) đinh
Hoặc không dùng “dầu” chung chung mà cần xác định rõ: Dầu ăn, dầu lửa, dầu thực vật, dầu bôi trơn...
Riêng đối với tên người, tên cơ quan, tổ chức và địa danh cần xây dựng bảng tra để sử dụng cho thống nhất.
Tính thuật ngữ: Từ khoá khác thuật ngữ nhưng cần có tính thuật ngữ. Đó là tính thông dụng, dễ dùng, có phong cách khoa học và được các ngành khoa học chấp nhận, phù hợp với cách ước định về ngôn ngữ trong các ngành khoa học.
VD: Tai hoạ thiên nhiên è Thiên tai
Súc vật nuôi è Gia súc
Bò để giết mổ è Bò thịt
Bò để lấy sữa è Bò sữa
Thuyết Mac- Lênin è Học thuyết Mác – Lê nin
Thuyết hệ thống è Lý thuyết hệ thống
Hệ thống sinh thái è Hệ sinh thái
Tính hiện đại: Sử dụng thuật ngữ hiện hành mà không dùng cách cũ.
Worksheet Tờ công tác è Phiếu nhập tin, phiếu tiền máy
Miêu tả tài liệu è Mô tả tài liệu
Tính khách quan: Từ khoá phải dễ hiểu, không mang tính đánh giá, không phụ thuộc vào nội dung của tài liệu khi tách chúng ra khỏi nội dung tài liệu:
Thảm hoạ è Tai hoạ
Thảm họa thiên nhiên è Thiên tai
Nếp sống văn minh è Nếp sống
Tuy nhiên, có một số từ, cụm từ mang tính chất đánh giá, đã trở thành thuật ngữ thì phải chấp nhận. Ví dụ:
Công nghiệp nặng - Công nghiệp nhẹ
Phát triển bền vững (Phát triển có chú trọng môi trường)
Nông nghiệp sạch
Kim loại đen - Kim loại màu
Hình thức của từ khoá: Khi trình bày từ khóa, phải lưu ý về:
- Chính tả:
+ Dấu thanh: Việc thả dấu thanh mặc dù không ảnh hưởng tới việc đọc một từ nào đó nhưng khi tìm tin trong CSDL lại cho kết quả tìm khác nhau (“thủy” và “thuỷ”)
+ i và y: Tương tự như việc thả dấu thanh trong tiếng Việt, khi trình bày từ khóa phải thống nhất dùng chữ “i” hay “y” ở một số từ (“kỹ sư” và “kĩ sư”, “vật lý” và “vật lí”…)
- Dấu ngăn cách giữa các từ khoá: %, ;
Trên đây là vài nét khái quát về ngôn ngữ từ khóa. Khi tiến hành định từ khóa, người cán bộ thông tin ngoài việc nắm vững kỹ năng định từ khóa còn cần phải nắm vững các yêu cầu đối với từ khóa, cũng như các biện pháp để đảm bảo các yêu cầu đó để xác định chính xác (những) từ khóa cho từng tài liệu hoặc yêu cầu tin cụ thể.
Bài: Phạm Thị Thành Tâm - Khoa Thư viện Thông tin