30
Aug

Đi tìm cỗ máy tìm kiếm Việt

   Posted by: Chip   in Overview

Sau những rắc rối xung quanh câu chuyện Monava, thị trường tìm kiếm Việt Nam không những không lắng lại mà còn có phần sôi động hơn rất nhiều với sự ra đời của hàng loạt các trang gán mác cỗ máy tìm kiếm Việt (Search Engine- SE).

Có chăng SE Việt đúng nghĩa?

Câu trả lời là: rất ít. Đa số các SE ở Việt Nam mới chỉ dừng lại ở mức sử dụng công nghệ của nước ngoài, mà phổ biến nhất là API của Goole, Yahoo hay các phần mềm mã nguồn mở Lucene, Sphinx. Ví dụ như Monava sử dụng API của Google, Zing Search và Baamboo sử dụng công nghệ của Lucene, Timnhanh với dòng chữ “Powered by Yahoo”, iHoatieu (iHoatieu.com- trang tìm kiếm việc làm mới ra mắt) sử dụng Zoom Search Engine,…

Một chuyên gia giấu tên - người hiện đang xây dựng 2 SE khá nổi ở Việt Nam cho biết: “Rất nhiều trang được xem là SE, trong khi thực tế chỉ là trang nội dung có chức năng tìm kiếm. Những trang đó chứa sẵn nội dung, hoặc tổng hợp nội dung và bày ra trên trang chủ. Một số ví dụ trang dạng này có thể kể đến Mp3 Zing, Thổ địa. Tuy nhiên tất cả chỉ mang ý nghĩa tương đối, không phải cứ mang danh SE là “oai”, miễn là mang lại giá trị cho người sử dụng là được.”

SE - Cuộc chơi của các đại gia

Điểm mặt lại các SE đình đám của Việt Nam hiện nay: Baamboo.com của VC Corp, được Quỹ IDG Ventures đầu tư 2 triệu USD, Tinh Vân bỏ ra 2 triệu USD để đưa Vinaseek đình đám 1 thời trở thành Xalo.vn, Zing Search cũng được Vinagame đầu tư hàng tỷ đồng, JSeeker.vn của Job Seeker Pty Ltd.- một công ty của người Việt Nam tại Úc,… chúng ta không thể không đặt ra câu hỏi: “Liệu có phải SE chỉ là sân chơi dành cho các đại gia?”

“Làm một SE thực sự là một công việc vô cùng phức tạp. Vì số lượng website rất lớn nên lưu giữ chúng cần nhiều server. Vấn đề là người sử dụng muốn có được kết quả trong chưa đầy 1 giây. Người làm SE cần phải có một mạng lưới server lớn, thiết kế được một phương thức lưu trữ dữ liệu và kết hợp dữ liệu trả về cực kỳ tốt”, ông Hoàng Việt Cường, Giám đốc Quản lý Job Seeker Pty Ltd. giải thích. Chính vì thế, nếu không có thực lực về tài chính và công nghệ, các công ty khó có thể xây dựng một SE có khả năng cạnh tranh được.

Ít tiền, thiếu thốn về công nghệ, các SE Việt Nam thường chọn đi theo hướng “vertical search”, tức là đưa ra công cụ tìm kiếm chuyên biệt trong lĩnh vực nào đó. Đây cũng có thể coi như một bước đi khôn ngoan tránh đối đầu trực diện với những tượng đài như Google, Yahoo. Một số trang đi theo hướng này và đã có ít nhiều tiếng vang như tìm kiếm việc làm có JSeeker, iHoatieu; tìm kiếm nhạc có Mp3 Zing, Baamboo Mp3, Ginggoong, 7sac, Miu; tìm kiếm địa điểm có Baamboo Bản địa, Thổ địa, Địa điểm, Izomi; tìm kiếm ebook có Bookilook;…

Ảnh: VNN

Ảnh: VNN

Những câu hỏi còn bỏ ngỏ

SE Việt thua SE nước ngoài bao xa? Khó để trả lời chính xác, nhưng chắc chắn là rất xa. Aliweb - được xem là cỗ máy tìm kiếm web đầu tiên trên thế giới ra đời cách đây 15 năm, trong khi thị trường tìm kiếm Việt Nam mới nở rộ từ khoảng năm 2002 với cú đánh đầu tiên của Vinaseek của Tinh Vân, Hoatieu của FPT. Vì thế, khó có thể hy vọng một SE Việt cạnh tranh với Google ngay lúc này được. Ông Hoàng Việt Cường cho rằng: “Để rút ngắn khoảng cách, chúng ta cần nghiên cứu nhiều hơn nữa trong lĩnh vực thu thập thông tin.” Tuy vậy, từ “nghiên cứu” có vẻ còn khá lạ lẫm trong các công ty tin học ở Việt Nam. Ông Cường cũng đồng tình rằng ít có công ty tin học ở Việt Nam ông biết có đầu tư đúng đắn cho R&D (Research and Development- Nghiên cứu và phát triển).

Liệu người Việt có chào đón các SE Việt? Ngay cả với Xalo, Socbay - vốn là những SE Việt được đánh giá cao, vị trí 2 trang này trên Alexa vẫn còn rất thấp so với Google.com.vn. Trong các topic thảo luận về vấn đề này trên một số diễn đàn lớn, không ít người cho rằng Google là quá đủ. Bài học thành công từ Baidu của Trung Quốc phải chăng không áp dụng được cho Việt Nam?

Một vấn đề đã cũ và còn nhiều tranh cãi là vấn đề bản quyền, đặc biệt với những trang tìm kiếm nhạc, video, ebook. Việc Mp3.zing.vn và Socbay.com phải trả phí sử dụng cho các hãng băng đĩa thông qua hiệp hội ghi âm Việt Nam RIAV có thể được coi như một lời nhắc nhở cho các công ty Việt Nam khi muốn xây dựng một SE thực sự.

Và hơn hết cả đó chính là câu hỏi về lợi nhuận. Doanh thu của SE nói riêng và của Internet nói chung đến chủ yếu từ quảng cáo. Trong khi đó, ước tính doanh thu của quảng cáo trực tuyến trên tổng ngành quảng cáo tại Việt Nam chỉ ở mức 1,5% (theo báo Lao Động số 40 Ngày 22/02/2008), và dịch vụ Adwords của Google đang ngày càng phổ biến ở Việt Nam, liệu doanh thu có bù lại được những khoản tiền đầu tư khổng lồ? Thế giới Internet đang thay đổi từng ngày, khó để có thể nói trước được bất cứ điều gì. Thế nhưng, chúng ta có thể chốt lại bằng lời nhận xét của ông Nguyễn Thế Tân, Phó Tổng Giám Đốc VC Corp- đơn vị sở hữu Baamboo và iHoatieu: “Đôi khi người ta nghĩ quá nhiều về lợi nhuận mà quên mất công việc quan trọng nhất là phải làm tốt sản phẩm trước đã. Cứ tin rằng một khi sản phẩm thắng lợi, chắc chắn sẽ có cách thu tiền từ nó.”

Hạo Nguyên

Bài viết đăng trên Thời báo Vi tính Sài Gòn số ra ngày 25/8/2008 và Cổng thông tin điện tử http://saga.vn

Tags:

This entry was posted on Saturday, August 30th, 2008 at 2.10 am and is filed under Overview. You can follow any responses to this entry through the RSS 2.0 feed. You can leave a response, or trackback from your own site.

11 comments so far

tuanna0703
 1 

SE là sân chơi riêng của các đại gia cũng đúng vì ngoài cơ sở hạ tầng tốt với chi phí tốn kém thi thỉnh thoảng lại bị các bác nhà nước hỏi thăm về bản quyền này nọ, lằng nhằng là các bác ý lại đóng cửa ngay site của mình. Nói chung là bây giờ làm cái gì ngon nghẻ cũng cần phải có “đại gia”

2008-08-30 at 9.13 am
 2 

Bài viết hay lắm, khá chuẩn ;)

Anh bổ sung thêm: về công nghệ đa số các SE của VN đều mua hoặc sử dụng mã nguồn mở thậm chí dùng Full-text search trong DB :|, nếu không nhầm thì trước đây Vinaseek dùng dtSearch.

Công nghệ để làm SE rất phức tạp, để có thể làm chủ (chứ chưa nói tự xây dựng) những công nghệ nguồn mở để cấu thành SE cũng không phải việc đơn giản: Crawler, lưu trữ, analyzer, parser, xử lý ngôn ngữ,… vô vàn thứ khó khăn và tốn kém nên đây sẽ là cuộc chiến dài hơi tốn tiền và sẽ có đổ máu.

Có thể khẳng định tất cả các SE của VN đều theo vertical search, trong số này anh ấn tượng với JSeeker nhất cả về sản phẩm và chất lượng search của họ.

Chúc em Chip ăn no chóng lớn để viết về Web 2 ác liệt hơn, tiến tới viết về Web 2.01 hoặc 2.01 RC1 gì gì đó :D

P/S: có 1 typo Sphinx chứ không phải Spinx

2008-08-30 at 9.32 am
 3 

Chưa bàn tới vấn đề kỹ thuật, anh chỉ nói sơ qua về cái mà người Việt làm SE để làm gì?

Theo cái kiến thức nông cạn của anh thì các đại gia làm SE hầu như để quảng bá tên tuổi cho họ, để họ có danh tiếng rồi họ làm ăn theo hướng khác. Chứ lợi nhuận quảng cáo từ SE ở Việt Nam có vẽ còn lâu lắm.

2008-08-30 at 9.59 am
 4 

Hi Chip,

With me, Google Search Engine isn’t the search tool, but Vietnamese Search Engine is. How many CEO of Vietnamese Search Engine know about how to do the magic with their search tool? I means what business they can make with their search tool if they can defeat Google, Yahoo at Vietnam?

(Sorry, I have to use English because my computer don’t have Vietnamese typing mode.)

Duc Ban.

2008-08-30 at 11.56 am
 5 

Bài viết rất tốt. Phúc rất thích đọc các bài viết chất lượng như vậy. Chờ bài viết mới của Chip đó !
Rất vui được liên kết với Blog Chip 2.0
Chúc Blog phát triển nha !

2008-08-30 at 2.48 pm
 6 

Không biết bà Chip là người như thế nào nhỉ? Béo hay gầy vậy ta? Đương tìm hiểu.

2008-09-03 at 10.16 pm
 7 

@Tuanna0703: Defenitely true ;) Đại gia và kiên nhẫn. Đọc comment trên LinkHay í anh.
@Javacola: Thanks anh về thông tin Hoatieu và typo, em sửa lỗi đấy đây :D Xa lộ có phải là vertical search đâu. JSeeker là của anh Hoàng, anh ý ở Úc cũng 6 hay 7 năm rồi. Đó là bản việt hóa của Jseeker.com.au.
@Nguyễn Tiến Sĩ: Hehe, quảng bá tên tuổi có thể là 1 ý hay nhưng chẳng ai lại lấy 1 sản phẩm tồi ra để quảng bá cho tên tuổi của mình cả ;) Vấn đề lợi nhuận thì ko chỉ SE mà với đa số các dịch vụ web của VN vẫn còn là 1 câu hỏi.
@DucBan: It’s ok whether you write VNese or English, always welcome you here. Yeah, I wonder too, but I don’t think it’s time for day-dreaming :P Search Tool you said sounds new to me, hmm, can you explain a bit further?
@Danhbaweb20: Thanks Phúc nhiều nhé, Chip sẽ cố gắng.
@Nguyễn Hùng: Ặc, bà nào ở đây =.= Cũng đang tò mò không biết Nguyễn Hùng là người thế nào.

2008-09-04 at 1.31 am
 8 

Theo Hùng đoán mà thì Chip là con gái, đang tìm hiểu là bao nhiêu tuổi. Rất vui khi được biết Chip. SAo tên giống Bim bim thế nhỉ?

2008-09-04 at 9.48 am
 9 

Không lẽ là con trai à :)) Chắc cũng tầm tuổi Hùng thôi. Hùng đang làm cho Google hay sao mà lăng xê Google ghê thế :D

2008-09-04 at 1.35 pm
Nai
 10 

http://www.laodong.com.vn/Home/Co-may-nao-cho-may-tim-kiem-Viet/20085/88692.laodong

Bài này cũng theo mạch vấn đề đó.

2009-01-06 at 10.34 pm
 11 

@Nai: Bài đấy trên báo Lao động viết khá hay, em cũng tham khảo 1 chút khi viết bài này.

2009-01-07 at 5.46 pm

3 Trackbacks/Pings

  1. Chip 2.0 » Blog Archive » Đi tìm cỗ máy tìm kiếm Việt    2008-08-30 / 2008-08-30:

    Xin chào !…

    Bài viết của bạn đang được thảo luận trên Linkhay.com . Bạn hãy vào để thảo luận và theo dõi….

  2. Kỷ nguyên Web 2.0    2008-09-03 / 2008-09-03:

    My 2.0 way - phần 1…

    Nhân dịp bé Chip vặn hỏi mấy lần “anh làm web, vậy khi nào ra tiền?”, đây cũng là một câu hỏi nhiều người thắc mắc. Đã thế tiện thể trả lời luôn một đống câu hỏi nhiều người th…..

  3. Top Vietnamese Tech Blog Posts - 2008 | Top Vietnamese Tech Blog Posts - 2008 - Công nghệ số    2009-06-20 / 2009-06-20:

    [...] Trần - Tiếng Anh Twitter fails in Vietnam (11/12/2008) - Nguyễn Anh Hùng - Tiếng Anh Đi tìm công cụ tìm kiếm Việt - Huyền Chip - Tiếng Việt CyVee Encore - Nguyễn Anh Hùng - Tiếng Anh How to [...]

Leave a reply

Name (*)
Mail (will not be published) (*)
URI
Comment