LSI: Indexación de Semántica Latente

Cuando hace un tiempo comentaba sobre los avances en "La Red Semántica" y los problemas que enfrentaba este tipo de iniciativas, surgió el tema de las taxonomías y el "como estructurar la infromación" para hacer que tengan sentido las cadenas de datos y datos.

Ahora, vía un blog que no guarde el link, veo un paper de Clara Yu, John Cuadrado, Maciej Ceglowski y J. Scott Payne aborda el tema de la indexación semántica aplicada a los motores de búsqueda en Internet con tres "simples" objetivos:

1. Queremos que nos dé TODA la información relevante disponible sobre nuestro tema.
2. Queremos que nos dé SOLAMENTE la información que es relevante para esa búsqueda.
3. Queremos que la información esté ordenanda de alguna forma, para poder ver los resultados más relevantes primero

Esto no es "simple" sino el objetivo ideal de todo motor de búsqueda, lo que en algun momento prometió Inktomi, luego Pagerank y así sucesivamente.

De hecho, la compra de Applied Semantics en Abril del 2003 demostró que lograr esto es central en la estrategia de los motores de búsqueda.
Leer completa

| WebServices

Tarjetas por voz

Los sistemas de identificación e identidad para productos y personas ya están llegando a niveles "extremos" ahora, BeepCard presenta una tecnología para tarjetas de crédito con una clave por voz!

La tarjeta no autorizará transacciones a no ser que escuche la clave del dueño autorizando la compra; en la misma tarjeta incluirán un micrófono, un parlante, una batería y un chip de reconocimiento de voz, aunque esperan prevenir fraudes creo que sólo servira para evitar "robos de identidad". Entre esto y los RFiD tags en los productos, la paranoia sobre la privacidad tiene cada vez más facetas.

| Rants

"Enfrentamos una significativa competencia de Microsoft y Yahoo"

El famoso "formulario S1" que tuvo que completar Google para empezar el proceso de salida a la bolsa debe presentar información transparente, completa y detallada sobre ingresos, egresos, equipo de trabajo, riesgos y ventajas para que los potenciales inversores sepan exactamente en que van a invertir.

Como diría Dirson "El 'S-1' consta de 174 páginas y cada línea es una noticia"; la sección "Risk Factors" es interesantisima renglón por renglon, en resúmen:

- Microsoft y Yahoo! son nuestra principal competencia.
- Microsoft y Yahoo! tienen mayor historial de operacion y por eso mejor relacion con los clientes. Tienen mas plata y mas empleados que nosotros. Y funcionan como portales de internet que ofrecen mas productos y servicios.
- (y tal vez lo más importante) Si logran que sus resultados de búsqueda en internet sean precisos como los nuestros y Microsoft hace que esto se integre con Windows.. podemos perder mucho tráfico y por consiguiente ganancias

Creo que ese pequeño resúmen tiene datos tan obvios como peligrosos; pero al mismo tiempo creo que como ya había dicho hace un tiempo "Google va camino a convertirse en un portal de nueva generación" y Blogger, Gmail, Froogle, Orkut y estas iniciativas sólo demuestran que ese camino es el futuro de Google para poder competir partiendo de una base menor de clientes, ingresos, efectivo y estructura.

Interesantemente, Bill Gates ya había anticipado que su motor de búsqueda era "una porqueria" pero dijo claramente "en dos años seremos mejores que Google"; y Yahoo! hace un año que eesta volviendo a sus orígenes y revitalizando completamente sus servicios de búsquedas incluyendo hasta busquedas locales y de compras.

A continuación la traducción literal del párrafo sobre MS y Yahoo! completo.
Leer completa

| Google

Declaración de principios

En medio de la noticia ya anticipada de Google y su oferta pública de acciones, ya empezó a circular el prospecto que acompañará la propuesta de inversión que manejen sus bancos y su "IPO-subasta". En general estas cartas son escritas por el CEO de una empresa, retocada por los "agentes de PR" y finalmente por los representantes de los bancos de inversión.

La carta que Larry Page y Sergey Brin escribieron y acompaña el "prospecto" es real y absolutamente interesante. Inspirada en los memos de Warren Buffet (uno de los pocos inversionistas dignos de admiración) a Berkshire Hathaway; parece más una declaración de principios que un pedido de inversión.

Dejando de lado que la traduccion que sigue es mía y puede haber errores; creo que mas de un concepto vale la pena extraer:

1- No compren acciones en la IPO de Google si creen que el valor es demasiado alto y no puede ser sostenido en el tiempo. Esto lo beneficará a ud. y a la empresa.
2- Los empleados y los usuarios son nuestra máxima prioridad. Somos lo que somos por los empleados. Y logramos lo que logramos al darle a los usuarios resultaados de búsqueda imparciales, con publicidad claramente marcada y separada, servicios de máxima calidad gratuitos y no tenemos porque cambiar.
3- Largo plazo vs. ganancias trimestrales. No inviertan en Google si no buscan crecer a largo plazo, no vamos a cambiar nuestra forma de manejar la empresa por mostrar mejores resultados trimestrales en la bolsa. Ni vamos a dejar de tomar riesgos si la recompensa es interesante.
4- Nos vamos a manejar con un "Dual-Class voting scheme", como los medios para que prive la transparencia y las decisiones no sean tomadas pensando en el corto plazo

Sinceramente rompen moldes en casi todo lo que hacen; y ahora con esta "carta de los fundadores" lo siguen haciendo.

Que tomen como a modelo Warren Buffet es, para mi al menos, uno de los puntos que los hacen mas atractivos para invertir y confiar en la empresa. Traduje la carta completa, asi pueden entender de boca de los propios fundadores la visión que los mueve y como pretenden hacer de google una inversión rentable, para ellos, para los inversionistas, para los empleados y mantener el servicio de siempre.
Leer completa

| Estrategias

Es oficial: Google sale a la Bolsa

Buscando juntar u$s2,7 Billones de dólares, Google ha llenado los documentos en la SEC para salir a la Bolsa e implementará un sistema para hacer "subastas de acciones" permitiendole a los inversores individuales comprar acciones sin darle ventaja a los bancos y/o fondos de inversion.

Update: Mirando los números
Se estima que si logran alcanzar esa cifra, su valuación de mercado va a estar alrededor de los u$s20Bn o u$s25Bn; pero sería interesante comparar (ahora que tenemos números reales) con Yahoo! (a quien podríamos considerar su competir más fuerte) que tiene una valuación de u$s38Bn
Leer completa

| Internet

Demorando el anuncio de la IPO mas esperada de los ultimos años

En febrero se anunció que la auditoría interna realizada ya daba un "certificado de salud financiera" cumplimentando lo referido a la ley Sarbanes-Oxley (pdf).

Morgan Stanley y Credit Suisse First Boston, hace 2 días, lograron ser seleccionados como "underwriters" de la IPO más esperada de los últimos años y que esperan disparará el mercado nuevamente a la estratósfera.

Mediante su oferta inicial pública de acciones de Google (De ellos hablamos) espera recaudar entre mil y dos mil millones de dólares, llevando la cotización de la empresa a u$s20.000 millones y (para no perder la costumbre) introducirán un par de innovaciones para que los inversores individuales no tengan que pasar por los inversores institucionales y terminemos pagando sobreprecios.

El día "D", es mañana 29 de Abril de 2004, gracias a que al pasar la barrera de 500 poseedores de Stock-Options y alcanzar activos por u$s 10 millones, un párrafo del acta de la SEC obliga a reportar sus finanzas obligatoriamente, dando detalles de: Operaciones, Finanzas, Ventas, Ganancias y balances.

Y al revelar estos datos, que deberían revelarlo igual al hacer una IPO, que siempre mantuvieron en reserva... el mercado ya va a tener la información precisa para calcular su valor real. Además de los empleados de Google que deben estar esperando para hacer efectivo o "poner en hold" sus stock-options, Sequoia Capital y Kleiner Perkins Caufield & Byers van a empezar a recuperar sus inversiones.

A los bolsillos de estos gigantes de Venture Capital (son los que pusieron plata en Amazon, Yahoo!, Netscape, etc.), sumenle los mil o dos mil millones que esperan recolectar, integren el equipo de Doctores en CS que están reclutando y pensaremos que Google va a tener todo para "dominar el mundo", sólo tengamos cuidado de no caer en la "irrational exhuberance".

| Internet

Primeros 10 programas que instalo

Veo un thread interesante en Slashdot : First Ten Programas on New Install? y luego de leer varias respuestas divertidas, útiles y etc se me ocurrio hacer mi propia lista:

1- Office XP: único en ambiente corporativo.
2- Norton Antivirus 2004: Sigue siendo el AV con mayor facilidad de actualización y etc.
3- WinRar: hace tanto que lo uso que WinZip me parecería raro usarlo :)
4- Firefox: y en toda PC que instalo es lo mismo
5- WinAmp: la mejor manera de escuchar música sin caer en iTunes ni en WMP
6- ObjectDock: app para tener una barra de herramientas muy útil a mano
7- Macromedia Studio MX 2004: todo junto y listo
8- WS_FTP pro: y testeando FileZilla
9- Adobe Photoshop: primero de la familia entera Adobe
10- Trillian: nada mejor que esto para manejar mi Jabber, MSN, AIM, Y!Messenger, etc.

¿Alguien más tiene una lista?
Nota: Los programas son en orden de Instalación y luego del OS. No vale decir "Linux!" :P

| Rants

Plaxo

Hace unos cuantos meses, y con cierta constancia, estoy borrando "invitaciones" paa completar mis datos en Plaxo.

Como nunca completé mis datos, excepto alguna que otra dirección de mail, cada vez que alguien abre una cuenta y quiere "evitar el frustrante problema de los datos desactualizados" conmigo.. me aparece una nueva invitación a completar los datos y yo, ahora mas que nunca, no me siento seguro de confiar mis datos a una empresa XX y menos a Plaxo!
Leer completa

| Comunidades Online

La pelea entre la UE y Microsoft sigue "escalando"

Desde la recomendación emitida por las autoridades antimonopolio de la Unión Europea para frenar las actividad ilegales de Microsoft, la pelea parecía entrar en un segundo plano. Pero en este mes de "silencio informativo" lo que empezó como una pelea ya parece una guerra.

Por un lado, el Congreso Estadounidense (con la peor de las diplomacias posibles) les dijo a la UE que "la conducta de Microsoft no es problema de uds."; por otro lado, la Unión Europea dice que tomaron como prueba documentos internos de Microsoft con perlas tales como "Es el switching-cost (que Microsoft posee por su API) lo que da (a los clientes) la paciencia para quedarse con Windows aún con nuestros errores, nuestros problemáticos drivers, nuestro alto TCO, ..." y Microsoft mientras tanto lanzó una respuesta de 7 páginas acusando a la UE de "inventar leyes contra la innovación".

De pronto tuve un deja-vu
Leer completa

| Microsoft

Telefonía móvil via Wi-Fi

IDT planea convertirse en la primer compañia en ofrecer servicios de telefonía sobre redes WiFi, mediante hot-spots en Newark, NJ. En menos de 60 días ya estaría funcionado un test general y de paso respondiendo mis preguntas.

Sobre la plataforma de VoIP de Net2Phone, piensan ofrcer llamadas entrantes sin cargo y llamadas salientes por "centavos (aunque no especificaron cuantos)"; claro que teniendo en cuenta que no tendrán que desembolsar plata por "costos de interconexión" y que los costos de infraestructura son increíblemente menores que los de instalar radio-bases, este modelo de negocios tiene sentido y reafirma mi idea de que las compañias de celulares van a tener que ofrecer cada vez más y mas servicios para seguir creciendo, porque en áreas urbanas VoIP+WiFi es una combinación genial.

| Mobile

Clarin se mete más en los weblogs

Se comenta que Clarin lanzará en estos días un renovado weblog, contratando a una empresa para el diseño e implementación total del sistema. ¿Estarán desarrollando una herramienta propia como se pensó en un primer momento?

Lo que muchos medios no terminan de entender es que un weblog forma una "micro"comunidad; pensar que una herramienta puede evitar que tengan que quitar los comentarios es ridículo (por no decir estúpido), pero parece que luego de una primera experiencia con los weblogs y, aún restringiendo la temática a un weblog de humor, no pueden "dominar" a los comentaristas; pero no se desesperen, nadie que no entienda a una comunidad y solo la vea como una fuente de ingresos lo va a lograr.

| Weblogs

Controversia por el uso de Linux en el ámbito militar

Vía NewsForge, en una entrevista que vale la pena leer por la cantidad de contradicciones que tiene, veo que el presidente de Linux Users Group Los Angeles renunció a su cargo por "el uso de Linux en desarrollos militares y lo que mi país está haciendo en Irak"

Las aplicaciones que desarrollaron en USA y que usan o se basan en Open Source, eran básicamente Simuladores de Entrenamiento (en Slashdot); aunque ahora están usando Mozilla como interfaz de comando para el "Swift2", supuestamente el Buque de Asalto Rápido más avanzado a nivel tecnológico del mundo.

Sinceramente creo que esta persona está tomando una decisión ridícula y política; primero culpa a la herramienta (Linux) por el uso que se le da y segundo, si ese fuese un motivo realmente válido:
¿No sería momento de dejar de usar Internet tambien porque fue desarrollada sobre conceptos militares y financiada por el Departamento de Defensa de Estados Unidos (DARPA)? y, los desarrollos como SELinux (FAQ no oficiales) ¿No deberían dejarse de lado por tener contribuciones de tecnología del DoD o de la de NSA?

| Open Source

Señales mezcladas

Mientras unos dicen que la venta de música cae por culpa de los archivos de música compartidos via P2P, un nuevo estudio revela que:

"sin importar como usemos los modelos estadísticos, no podemos encontrar una conexión entre la baja de ventas y los downloads desde Internet"

Al mismo tiempo, la RIAA acaba de iniciar juicio a 532 "sharers" en Estados Unidos y en Europa la IFPI inicia juicios a otros 247 individuos por "descargas ilegales"; y aunque el estudio esta siendo atacado de todas partes; me pregunto si un investigador de economía de Harvard (Felix Oberholzer-Gee) y otro de la Universidad de North Carolina (Koleman Strumpf) jugarían sus reputaciones con este tema y, de ser ciertas sus conclusiones, ¿como influirá esto en la estrategia de las Asociaciones que persiguen a los "sharers"?

| P2P

Negociando con CABASE

Finalmente parece que una solución está llegando en el conflicto del NAP de CABASE, con una Intimación a Restituir el Servicio con niveles de calidad anteriores al conflicto. Si no cumplen con esta medida cautelar caerían en "desobediencia" (Art.239 del Código Penal) y debe ser cumplida en un plazo de 10 días.

Luego de los tibios comunicados de prensa finalmente aparecieron cosas interesantes.
Leer completa

| Internet

Comparando ingresos y performance

Como muchos saben, la semana pasada se conocieron los resultados trimestrales de muchas empresas de tecnología que cotizan en Bolsa, entre ellas Nokia y Samsung, aprovechando que la información es pública y bien detallada, me detuve en un detalle interesante: La pérdida de market-share de Nokia y el aumento en participación de Samsung.
Leer completa

| Mobile

The Economist: More balls through Windows

Pocas veces ví un artículo en los medios con el que comparta tantos puntos de vista. "The Economist: More balls through Windows" analiza las ventajas y desventajas que tiene Linux hoy en día para llegar al desktop en las PC´s; mencionando incluso la oportunidad que la demora de Longhorn, la próxima versión de Windows, abre para Linux y otros OS, pero haciendo hincapié en puntos como instalación, aplicaciones, GUI y otros tiene, a favor y en contra Linux.

Aunque The Economist es una de las pocas publicaciones que sigo con "devoción" por su fusión entre teoría y hechos, siguen sorprendiendome por su capacidad de resumir tendencias globales en conceptos claros y simples de entender.
Nota, el resto de la nota es Copy&Paste en caso que no puedan acceder a la noticia
Leer completa

| Open Source