
В Radar Networks заявляют, что ее продукты катализируют развитие «нового измерения» веба, которое станет следующим рубежом для интернет-поиска, рекламы и электронной коммерции. По некоторым данным, разработки Radar Networks базируются на технологиях американских военных и разведчиков. Компанию основал в 2003 г. г-н Нова Спивак (Nova Spivack), она финансируется Vulcan Capital и Leapfrog Ventures, имеет штаб-квартиру в Сан-Франциско.
Базирующаяся тоже в Сан-Франциско Metaweb Technologies также специализируется в области семантического веба. Компания финансируется Benchmark Capital, Millennium Technology Ventures, Omidyar Network и другими инвесторами. Что компания разрабатывает — держится в режиме секретности, возможно, первые ее продукты появятся в 2007 г.
К выходу готовится продукт еще одного стартапа в области семантического веба — Powerset. Это поисковик одноименной компании в Силиконовой долине, который будет использовать так называемый «натуральный язык», например, понимать разницу между поиском «книг о детях» и «книг для детей».
Эксперты неоднозначно оценивают выход на рынок указанных «пионеров». Ричард Макманус (Richard MacManus) и его соавторы пишут в статье «2007 Web Predictions», что появление продуктов Metaweb и Radar Network в следующем году окажет положительный эффект на развитие семантического веба. Российские эксперты оценивают его более скептически. «Для обработки обычных документов такие разработки идут давно по всему миру. Эти „секретные“ технологии доступны и другим странам. Так что революции тут никакой нет», — заявляет Джан Хан-Магомедов, исполнительный директор Регионального общественного центра интернет-технологий.
"Термин «семантический веб» — пока не больше чем маркетинговая уловка, как и Web 2.0, под которым каждый понимает свое, но большинство — просто рекламный трюк, ориентированный в первую очередь на инвесторов", — считает Евгений Альтовский, эксперт МОО ВПП ЮНЕСКО "Информация для всех". «Когда говорится, что технологии обкатываются „в скрытом режиме“ и о них мало что известно, сразу вспоминается стык тысячелетий, когда даже коврики для мыши продавались под девизом web-enabled и Internet-ready, — говорит г-н Альтовский. — А еще вспоминается „мыльный пузырь“ DotCom’ов, после которого выжили лишь единицы — те, кто вкладывался не столько в рекламу, сколько в реальные разработки. Когда эти разработки были приняты рынком, никто уже и не вспоминает, что они должны были перевернуть мир, — их просто используют, потому, что они нужны и удобны, а не из-за их абстрактной революционности».
У семантического веба есть такая проблема, как необходимость массового изменения кода веб-страниц для того, чтобы новые поисковики стали эффективными. Известно, как много времени требуется для внедрения стандартов веб-дизайна. Многие сайты крупных корпораций еще даже не перешли на XHTML, не говоря об XML, дающем возможность структурирования информации веб-страниц вместо простого форматирования HTML. «Программистам работы будет много. Далеко не сразу и далеко не все перейдут на эту технологию, пройдет немало лет, — говорит Джан Хан-Магомедов. — Возможно, появятся средства полуавтоматической конвертации, разумеется, с кучей ошибок. А пользователь получит, конечно, совсем иной сервис — умный поиск».
Есть и проблема недобросовестных владельцев сайтов, которые, конечно, воспользуются возможностями семантического веба для рекламы и мошенничества.
Основная идея семантического веба — научить компьютеры лучше «понимать» информацию. Используя язык RDF (Resource Description Framework), можно ввести семантические подсказки в разметку веб-страниц, позволяющие сделать поиск более осмысленным. RDF основан на синтаксисе расширяемого формата XML, который лучше подходит для представления отношений между данными. Семантику данных такого «продвинутого» веба можно определять и с помощью языка OWL, доступ к ним производить с использованием языка запросов SPARQL.
В конце концов семантический веб должен превратиться в обширную и децентрализованную базу данных. Поэтому важной его проблемой является онтология, то есть наиболее общие описания. Возникает вопрос, можно ли будет покрыть такими описаниями все многообразие данных в Сети.