daniel@home:~$

Stract un buscador de código libre

En los últimos años, el uso de Google ha empeorado, ya que los resultados parecen estar copados por contenidos SEO, resultados generados por inteligencia artificial y sitios web con montones de enlaces de afiliados y anuncios. En respuesta a esta situación, un programador ha lanzado un nuevo motor de búsqueda de código abierto, en parte como respuesta al ecosistema de búsqueda abrumadoramente corporativizado y homogéneo de Internet. El nuevo buscador, llamado Stract, funciona en un servidor en el sótano de la oficina de su desarrollador, es altamente personalizable y, según los comentarios de los usuarios en el Discord del proyecto, está mejorando rápidamente.

El proyecto surgió de la tesis de máster de su fundador, Mikkel Denker, en la Universidad Técnica de Dinamarca, que se centraba en ayudar a la gente a buscar sus propios archivos y documentos, según me contó en un chat en línea. La semana que viene terminará el máster y se dedicará a Stract a tiempo completo.

“La mayoría de nuestras búsquedas pasan por el mismo puñado de entidades (Google, Bing, Yandex)”, me dijo Denker. “Incluso otros motores de búsqueda como DuckDuckGo utilizan Bing para sus resultados. Me parecía muy raro que no hubiera forma de navegar por la web de forma abierta. Así que eso es lo que intento construir”.

Hay un puñado de motores de búsqueda independientes y algunos son de código abierto. Pero Stract es especialmente notable porque es muy personalizable, funciona rápido, utiliza su propio índice web y es muy fácil de usar, a pesar de haber sido creado principalmente por una persona en su tiempo libre durante los últimos meses (Denker dice que un amigo le ayudó mucho al principio, pero que ahora está ocupado con un programa de doctorado). El desarrollador Rohan Kumar, que lleva tres años manteniendo una lista increíblemente exhaustiva y actualizada de motores de búsqueda con índices propios, escribió en su página web que Stract es “mi motor generalista favorito de esta página”. Denker dijo que desde que apareció en la lista del sitio de Kumar y recibió cierta atención en Hacker News, el sitio ha estado gestionando unas mil búsquedas por hora.

La característica más interesante de Stract se llama “Optics”, que son esencialmente instrucciones personalizables que se pueden dar al motor de búsqueda para ayudar a buscar tipos específicos de contenido o para restringir las búsquedas sólo a sitios web concretos.

Por ejemplo, actualmente hay Ópticas que permiten a los usuarios buscar sólo en sitios web que aparecen regularmente en los primeros puestos de Hacker News, buscar sólo en foros y tablones de mensajes, buscar sólo en sitios web federados en Fediverse y buscar sólo en blogs independientes. Como el proyecto es de código abierto, cualquier desarrollador web puede escribir su propio Optic o puede tomar y modificar cualquier Optic existente (cuyo código también es de código abierto). Stract también permite a los usuarios “gustar”, “no gustar” o “bloquear” sitios web concretos, así como eliminar del ranking los sitios web que contengan rastreadores de terceros o mucha publicidad. La función es similar a las gafas de Brave, pero las ópticas son más personalizables: “La idea es poner en manos del usuario todo el control posible sobre la búsqueda”, afirma Denker. Lista de las ópticas de Stract disponibles en la actualidad

“Parte de la ventaja de Stract proviene del hecho de que Google gana dinero de las páginas web que contienen anuncios de Google a través de su programa AdSense, y por lo tanto están incentivados para que estos resultados se posicionen más alto en los resultados de búsqueda, mientras que Stract puede centrarse únicamente en qué resultados son los mejores para el usuario”, dijo en el Discord del proyecto. En la página Acerca de Stract se dice que “si alguna vez nos volvemos malvados (tal vez cambiando nuestro lema), por favor, coge nuestro código y crea un competidor. El hecho de que tengas esta capacidad hará que nuestros valores estén siempre alineados con nuestros usuarios.”

Actualmente Stract no se monetiza de ninguna manera, pero su sitio web dice que eventualmente tendrá anuncios contextuales vinculados a términos de búsqueda específicos, pero que no rastreará a sus usuarios, lo que es similar al sistema que utiliza DuckDuckGo. Stract también planea ofrecer búsquedas sin anuncios a los suscriptores de pago.

Como hemos analizado en varios artículos recientes, el uso de Google se ha vuelto cada vez más frustrante en los últimos años. Le pregunté a Denker si creía que Stract podría evitar ser invadido por contenidos generados por IA y SEO. Dijo que es un problema difícil de resolver, pero que su objetivo es permitir a los usuarios personalizar sus propios rankings con el uso de Optics, “para que cada uno pueda decidir por sí mismo qué tipo de contenido debe priorizarse.”

Stract es el último participante en un mercado de búsqueda repentinamente revitalizado que incluye Kagi, que es un motor de búsqueda de suscripción de pago con el que he estado trasteando durante el último mes (y escribiré sobre la experiencia con más detalle en algún momento de las próximas semanas). De momento me gusta Kagi, pero funciona como un agregador de búsquedas que combina resultados de Google, Yandex, Mojeek, Brave y otras grandes presencias web como Wikipedia, Wikimedia Commons, TripAdvisor y Flickr, para crear sus resultados de búsqueda.

Stract, por su parte, está creando su propio índice, lo que supone una empresa colosal. “Internet es un lugar enorme y la mayoría de la gente sabe que no es precisamente trivial crear un índice de búsqueda”, explica Denker. “Dicho esto, en realidad tampoco es tan difícil como cabría pensar”.

Obviamente, un índice de búsqueda es fundamental para la usabilidad de un motor de búsqueda, y Stract me pareció un poco limitado mientras jugaba con él. No pude encontrar algunos de los sitios web que buscaba, probablemente porque aún no se han indexado (aunque los resultados de algunas de mis búsquedas fueron satisfactorios). Cuando escribí “New York Times”, por ejemplo, no apareció el sitio web del New York Times. La buena noticia es que el índice de Stract está creciendo rápidamente, y los usuarios han señalado en el Discord del proyecto que su experiencia está mejorando regularmente.

“Espero que los resultados de búsqueda mejoren bastante en el próximo año. Actualmente Stract está en fase beta, pero a medida que el índice crezca y nuestros modelos de clasificación mejoren, los resultados de búsqueda deberían seguir el mismo camino”, afirma Denker. “El índice ronda actualmente los 250 millones de páginas, y a medida que crezca esperamos tener mejores resultados de búsqueda. En especial, estoy intentando averiguar cómo gestionar mejor estos problemas de navegación.

Traducido de https://www.404media.co/this-guy-is-building-an-open-source-search-engine-in-real-time/

Publicado en: Blog

Tags:

¿Quieres subscribirte a las novedades que vaya publicando?