El buscador de Googleo buscador web de Google(en Google Search) es unen la web propiedad de, es el motor de búsqueda más utilizado en la Web, recibe cientos y cientos de millones de consultas cada día a través de sus diferentes servicios. El principal objetivo del buscador de Google es buscar texto en las páginas web, en vez de otro tipo de datos, fue desarrollado originalmente poryen mil novecientos noventa y siete.
El buscador de Google da por lo menos veintidos características singulares más allá de la palabra original. Estas incluyen, previsiones meteorológicas, zonas horarias, cotizaciones de bolsa,, datos sobre, cartelera de cine, información de, listas de comienzo y resultados deportivos. Hay funciones singulares para los números, incluyendo intervalos (70.. 73), costes, temperaturas, conversiones dey de monedas ("10,5 cm en pulgadas"), cálculos ("3 * cuatro + sqrt (6)-pi / 2"), seguimiento de bultos, patentes, códigos de área telefónico, y traducción de páginas mostradas.
El orden de los resultados de búsqueda (ghits por Google hits) en las páginas de resultados de Google se basa, en parte, en un rango de prioridad llamado "PageRank". El Buscador de Google da muchas opciones para la búsqueda adaptada, utilizando las operaciones booleanas semejantes como: exclusión ("-xx"), inclusión ("+ xx"), alternativas ("xx O yy") y comodín ( "x * x")
La frecuencia de empleo de los términos de búsqueda ha alcanzado un volumen que puede apuntar más tendencias económicas, sociales y de salud. Los datos sobre la frecuencia de empleo de los términos de búsqueda en Google (disponible a través de Google Adwords, Google Trends y Google Insights for Search) prueban que hay correlación entre los brotes de gripe y los niveles de desempleo y proporcionan la información más rápidamente que los métodos tradicionales de presentación de informes y encuestas del gobierno.
El doce de mayo de 2009, Google anunció que analizaría los micro formatos de hCard, hReview y hProduct para incrementar las páginas de resultados de búsqueda con lo que llamaron "".
En junio de dos mil once, Google introdujo "Google Voice Search" y "Google Images", características que dejan a los usuarios buscar palabras al hablar y por imágenes.
A finales de junio de 2011, Google cambió el diseño de su página principal con la meta de impulsar el empleo de herramientas sociales. Los enlaces de publicidad, socios de negocios y también información de empresas fue llevada al borde inferior del navegador.Uno de los cambios principales fue reemplazar la barra de navegación clásica con una negra. Eldigital de Google Chris Wiggins explica: "Estamos trabajando en un proyecto para darle una experiencia de Google nueva y mejorada y en los próximos meses, seguirán viendo más cambios de nuestra apariencia."
Back to top1) Resultado de la búsqueda
El porcentaje exacto del total de las páginas web que Google halla no se conoce, puesto que es muy difícil calcular. Google no sólo busca los índices y cachés de las páginas web, también toma "imágenes" de otros tipos de archivos, que incluyen, documentos de Word, hojas de cálculo Excel, Flash SWF, ficheros de texto plano, etcétera Excepto en el caso del texto y de, la versión en caché es una conversión de (X)HTML, dejando que aquellos sin la aplicación de visualización pertinente puedan leer el fichero.
Los usuarios pueden personalizar el motor de búsqueda, a través de el establecimiento de un idioma por defecto, a través de la tecnología "SafeSearch", filtrando y definiendo el número de resultados que se muestran en cada página. Google ha sido criticado por colocara largo plazo en las máquinas de los usuarios para almacenar las preferencias de estos, una táctica que también les deja continuar los términos de búsqueda del usuario y retener los datos durante más de un año. Para cualquier consulta, hasta los mil primeros resultados pueden ser mostrados con un máximo de cien por página. La posibilidad de concretar el número de resultados está disponible sólo si "Búsqueda instantánea" no está habilitada. Si "Búsqueda instantánea" está activada, sólo diez resultados serán mostrados, independientemente de cualquier ajuste.
1.1) Búsqueda instantánea
Google Instant, una mejora que muestra los resultados sugeridos mientras el usuario escribe, fue presentado el ocho de septiembre de 2010. Una de las preocupaciones es que la gente seleccione uno de los resultados sugeridos en lugar de terminar su petición, y que esa práctica podría ocasionar parcialidad cara empresas familiares u otros términos de búsqueda. Términos pornográficos y otros términos ofensivos están excluidos de los resultados sugeridos. La función instantánea aparece sólo en el lugar de Google original y las páginas no especializadas de iGoogle. Google espera que Google Instant las búsquedas sean de dos a 5 segundos más rápidas y afirman que en conjunto serían 11.000.000 segundos por hora. Los especialistas de marketing de motores de búsqueda especulan que Google Instant tendrá un enorme impacto en las localidades.
Junto al lanzamiento de Google Instant, Google deshabilitó la posibilidad de que los usuarios elijan ver más de diez resultados por página. La búsqueda instantánea puede ser desactivada a través de las "preferencias" del menú, mas el estilo de autocompletado de sugerencias de búsqueda ya no se puede desactivar. Un representante de Google dijo: "Está en consonancia con nuestra visión de una experiencia de búsqueda unificada de Google hacer popular las características útiles del motor en vez de mantener diferentes versiones de Google. Como la calidad de "Autocompletar" ha mejorado, nos pareció que era apropiado para todos nuestros usuarios tenerlo siempre y en todo momento activo."
1.1.1) Recepción negativa
Muchos usuarios han reportado haber sido inútiles de desactivar la búsqueda instantánea de entre sus preferencias de Google.
1.1.2) Censura
La publicación de 2600: The Pirata informático Quarterly ha compilado una lista de palabras que están limitadas por Google Instant. Estos son los términos que la búsqueda instantánea no mostrará. La mayoría de los términos son de forma frecuente vulgares y desdeñosos en sí, pero algunas búsquedas supuestamente intrascendentes como "Myleak" fueron eliminadas.
1.2) Búsqueda de productos
Además de su herramienta para la búsqueda de páginas web, Google también ofrece servicios para la búsqueda de imágenes, conjuntos de noticias, noticias de sitios, vídeos, buscar por localidad, mapas y artículos para la venta en línea. En dos mil trece, Google indexó más de 60 trillones de páginas web, 54.300 consultas por segundo ,400 millones de consultas por día, uno con tres mil millones de imágenes y más de mil millones de mensajes de Usenet. También pone en caché gran parte del contenido que indexa. Google opera otras herramientas y servicios, incluyendo Google News, Google Suggest, Google Product Search, Google Maps, Google Co-op, Google Earth, Google Docs, Picasa, Panoramio, YouTube, Google Translate, Google Blog Search y Google Desktop Search.
También hay productos disponibles en Google que no están relacionados directamente con búsquedas. Gmail, por servirnos de un ejemplo, es una aplicación webmail, mas incluye funciones de búsqueda, Google Browser Sync no ofrece facilidades de búsqueda, aunque tiene como meta organizar su tiempo de navegación.
Google también posee muchos productos que están en beta, como por ejemplo Google Social Search o Google Image Swirl.
1.3) Características especiales
Además de la primordial función de motores de búsqueda de texto, el Buscador de Google tiene más de 22 "características especiales" (que se activa al redactar cualquiera de las docenas de palabras de activación) en la búsqueda:
1.4) Búsqueda cifrada
En mayo de dos mil diez Google lanzó su sistema de cifrado SSL de búsqueda web. La búsqueda cifrada puede ser accedida por encrypted.google.com
Back to top2) Características
El buscador de Google consiste de una serie de sitios web. El más grande de ellos, el lugar google.com, es la página web más visitada del planeta. Ciertas de sus características incluyen un link que da la definición para la mayoría de las búsquedas incluyendo palabras del diccionario, el número de resultados que obtuvo en su búsqueda, enlaces a otras búsquedas (por poner un ejemplo, palabras que Google cree que son incorrectas, le proporciona al usuario un link a los resultados de búsqueda utilizando la ortografía propuesta por Google), y muchas cosas más.
Google +1 ayuda a las personas a descubrir contenido relevante y cuya meta es acrecentar los resultados de búsqueda de Google, ofreciendo un estado para mostrarles a las personas si la página es confiable o bien no. Cuando un usuario de Google utiliza los resultados de búsqueda de Google mostrará un botón +1 para recomendar la página y una anotación con los nombres de las conexiones de los usuarios que han recomendado su página.
2.1) Características de la interfaz
- Fondo blanco y fácil con cambios de cuando en cuando en el título, este cambio ocurre en días con significado histórico o días ciertos.
- La barra superior tiene: Web, imágenes, videos, mapas, noticias, compras, gmail, etc.
- Búsqueda por voz, deja una búsqueda más rápida que escribiendo, o si la escritura adecuada no se conoce.
- Cuando usas tu cuenta de Google, el historial de búsqueda se registra automáticamente.
- La tipografía del buscador de Google, es, una de las tipografías más utilizadas en las páginas web.
- Google Instant, que rápidamente produce búsquedas posibles que contengan los caracteres escritos. Por servirnos de un ejemplo, si escribes Goo, mostraría Google, Google maps, Google Translate...
2.2) Funciones para comunicación
- Comparte tus fotografías con el mundo. Es posible subir a la web tus fotos.
- Búsquedas de imágenes con ajustes opcionales, como tamaño, color, tipo y clasificación.
- Búsquedas de vídeos que se conectan a YouTube. También con ajustes opcionales tales como la duración, tiempo, calidad, además de otras fuentes que se relaciona con el tema que usted está buscando.
2.3) Google bomb
A raíz de su importante posición de liderazgo en el mercado, Google es objetivo principal del así llamadocontra buscadores. En este sentido se intenta posicionar la mayor cantidad posible de palabras de búsqueda entre los primeros resultados. Estas palabras claves muy frecuentemente no tienen ninguna relación con el contenido real de las páginas. Se utilizan técnicas como Páginas-Doorway, Farm-Enlaces o bien Page-Cloacking.
Esta posibilidad se comprobó por primera vez a la luz de la opinión pública en relación con una, que estaba orientada al presidente de los. La palabra de búsqueda "miserable failure" (en castellano: "fracaso miserable") fue enlazada por los contrincantes de Bush a la página oficial con la biografía de Bush en la.
Como contraparte procuraron los partidarios de Bush hacer lo mismo contra(director del documental). Desde ese momento los primeros puestos varían a menudo entre los dos.
Las manipulaciones que tienen como objetivo mejorar el ranking de websites especialmente en Google, son consideradas desde ese instante Google-Spamming. Para eludir el abuso, Google cambia sucon frecuencia.
2.4) Logotipo (Doodle)
En ciertas ocasiones, el logo en la página web de Google va a mudar a una versión especial, conocido como "Google Doodle". Al hacer clic en Doodle, llevará al usuario a una cadena de resultados de búsqueda de Google sobre el tema. El primero fue una referencia al Festival Burning Man en y otros han sido producidos para el cumpleaños de personas notables como Albert Einstein, los acontecimientos históricos como el cincuenta aniversario del bloque de Lego ,días festivos como el Día de San Valentín o acontecimientos del país donde se realice la búsqueda.
2.5) Consumo de energía
Google afirma que cada consulta precisa de alrededor de 1 kJ o bien 0,0003 kW h.
Back to top3) Optimización de Google
Puesto que Google es el buscador más popular, muchosdesean influenciar la clasificación de su sitio web en Google. Una industria de consultores ha surgido para ayudar a los sitios a aumentar su ranking en Google y en otros motores de búsqueda. Este campo, llamado optimización de motores de búsqueda ( SEOen inglés), trata de discernir patrones en los listados de motores de búsqueda y después desarrollar una metodología para mejorar la clasificación y atraer a más usuarios a los sitios de sus clientes.
La optimización de motores de búsqueda abarca tanto factores en la página (como el cuerpo del texto, los elementos del título, los elementos del título y la imagen de los valores del atributo alt) como factores de optimización fuera de la página (como texto de anclaje y el PageRank).La idea general es afectar el algoritmo de relevancia de Google mediante la incorporación de las palabras claves en la página, particularmente el título y el cuerpo del texto (nota: mientras más arriba esté en la página, mayor son las posibilidades de la prominencia de palabras clave y por consiguiente, su clasificación). Sin embargo, demasiadas reiteraciones de la palabra clave causan que la página para buscar luzca sospechosa para el algoritmo de control Google que evita.
Google ha publicado una guía para propietarios de sitios que deseen progresar su clasificación en el empleo de consultores legítimos de optimización.
Back to top4) Sistema distribuido
Unes un conjunto de computadoras separadas físicamente y conectadas entre sí por una red de comunicaciones distribuida. Google es uno de los sistemas distribuidos más complejos en uso. Su infraestructura ha satisfecho requisitos necesarios como: escalabilidad, desempeño, confiabilidad y carácter abierto.
- Tiene que ir lidiando cada vez con más datos.
- Lidiar con más peticiones con el desarrollo de usuarios.
- Busca mejores resultados.
4.1) Aspectos del motor de búsqueda
4.1.1) Rastreo (crawling)
La tarea de un es encontrar y obtener los contenidos de la Web y pasar el contenido a subsistemas de indizado. Para esto se emplea el softwareque, recursivamente, lee una página web dada obteniendo los enlaces y planificando nuevas operaciones de rastreo. La frecuencia de las visitas depende de cuánto cambia la página.
Google Hummingbird: En el mes de septiembre de dos mil trece Google lanzao Google Colibrí, nuevo algoritmo que viene a sustituir a Google Caffeine y cuyas principales novedades estriban en la posibilidad de contestar a preguntas en lugar de interpretarse cada una de las palabras por separado. Para Google ello supone un avance más cara el buscador inteligente. Google Colibrí no incidiría de una forma directa en penalizaciones, sino que supondría un avance en el desarrollo independientemente de cómo otras modificaciones como Google Panda o bien Google Penguin sí han introducido elementos de lucha contra el spam.
4.1.2) Indexación
Produce un índice de contenidos similar al de un libro. Técnicamente se denomina indizado inverso de palabras que aparecen en páginas web y otros recursos textuales como documentos en.pdf,.doc y otros formatos. No solo guarda la posición, también almacena otra información relevante como el tamaño de fuente y capitalización. Utilizando este índice, se reduce el número de páginas aspirantes de miles de millones a unas decenas de miles, según el poder discriminativo de las palabras buscadas.
La indexación también sostiene un índice de enlaces, llevando un seguimiento de qué páginas apuntan a una página web.
4.1.3) Clasificación (Ranking)
El problema con el indexado es que no proporciona información sobre la importancia relativa de las páginas web que poseen un conjunto de palabras clave. Todos los motores de búsqueda modernos tienen una clasificación que señala la relevancia de la página y asegura que las más importantes aparecen en los primeros puestos de la lista de resultados.
Google utiliza elPageRank para decidir la importancia de la página web. Está basado en los sistemas de ranking de las publicaciones científicas, un artículo es importante si ha sido citado por otros colegas del área. El ranking en Google también tiene en cuenta factores relacionados con la cercanía de la búsqueda a las palabras clave de la página logradas en el indizado inverso.
Los anteriores métodos basados en palabras claves usados por muchos motores de búsqueda que fueron una vez más popular que Google, clasificaban las páginas por la frecuencia con que los términos de búsqueda ocurrían en la página o bien qué tan a menudo fueron asociados los términos de búsqueda en todos y cada página de resultados.
Además de PageRank, Google ha añadido muchos otros criterios no mentados para determinar la clasificación de las páginas de las listas de resultados, se reportó que hay más de 200 indicadores diferentes. Los detalles específicos de los cuales se sostienen en secreto para dejarle a Google sostener una ventaja sobre sus competidores a nivel del mundo.
4.2) Arquitectura física adoptada por Google
La filosofía de Google en términos de infraestructura física es el empleo de un enorme número de PCs como base para generar un entorno para computación y almacenamiento distribuido. Típicamente un computador tendrá dos Tb de disco, 16 GB dey utiliza una versión reducida delde.
Estrategias contra fallo:al utilizar PCs de bajo costo, Google reconoce que unas partes de su infraestructura fallan, y por lo tanto se han diseñado unas estrategias para tolerar dichos fallos.
- El origen de fallos más común se debe a software, con unas 20 máquinas que precisan ser reiniciadas al día manualmente por problemas de software.
- Los problemas de hardware representan 1/10 de los fallos. El noventa y cinco por cien son fallos de disco o de DRAM.
Arquitectura física:está compuesta por los próximos componentes
- Los PCs están organizados en racks de entre cuarenta y 80 equipos. Cada rack tiene undeque provee conexión en el rack y hacia el exterior.
- Losestán organizados en clusters formados por treinta racks o más. Un cluster es una unidad básica de gestión que tiene determinado, por servirnos de un ejemplo, la localización y replicación de servicios. Cada rack está conectado a 2 switches de banda ancha a fin de que haya redundancia.
- Los se encuentran en centros de datos de Google que están repartidos por el mundo. En el dos mil Google tenía dos centros de datos en Silicon Valley y uno en Virgina. Desde ese momento el número ha aumentado significantemente y hay centros de datos en E.U., Irlanda, Bélgica, Japón, China, etc.
Capacidad de almacenamiento:si cada computador ofrece dos Terabytes de almacenaje, entonces un rack de 80 PCs ofrece 160 Terabytes, con un cluster de 30 racks se ofrecen 4,8 petabytes. No se conoce precisamente el número de máquinas que tiene la compañía mas podemos aceptar que cuentan con unos doscientos clusters, que ofrecen novecientos sesenta petabytes de almacenamiento, prácticamente 1 exabyte (10^18 bytes).
El sistema está compuesto por un conjunto de servicios distribuidos que ofrecen funcionalidad a los desarrolladores. Están divididos en las siguientes categorías:
Paradigmas de comunicación, que incluyen servicios para comunicaciones tanto recónditas como multicast.
- Protocol buffers: ofrecen un formato de serialización común.
- Publish-subscribe: servicio para la diseminación de acontecimientos.
Datos y coordinación, da almacenamiento y acceso ordenado a datos.
- GFS: ofrece un sistema de ficheros optimizado para las necesidades de Google, incluyendo el almacenamiento de archivos de gran tamaño.
- Chubby: aguanta la coordinación de servicios y el almacenamiento de volúmenes pequeños de datos.
- Bigtable: base de datos distribuida construida sobre GFS/Chubby.
Computación distribuida, proporciona servicios para el uso de computación paralela y distribuida sobre la arquitectura física.
- MapReduce: aguanta computación distribuida sobre conjuntos de datos grandes.
- Sawzall: es un lenguaje de alto nivel para la ejecución de computaciones distribuidas.
5) Mensajes de error
Algunas búsquedas dará el error "403 Forbidden error" con el texto
"Lo sentimos...... pero tu consulta se parece a las peticiones automatizadas de un virus informático o aplicación de spyware. Para proteger a nuestros usuarios, no podemos procesar su solicitud por los momentos. Vamos a restaurar su acceso tan pronto como sea posible, inténtelo de nuevo en unos minutos. Mientras tanto, si sospecha que su computadora o red ha sido infectada, posiblemente desee ejecutar un antivirus o bien eliminador de spyware para asegurarse de que sus sistemas estén libres de virus y otras aplicaciones malignas. Pedimos excusas por las molestias, y esperamos su pronto regreso a nuestra plataforma de Google."
A veces, seguido de un sistema CAPTCHA.
La pantalla fue reportada por vez primera en 2005 y fue una respuesta a la fuerte utilización de Google por empresas de optimización de búsquedas para contrastar el rango de los sitios que optimiza. El mensaje es provocado por un gran volumen de peticiones desde una única dirección IP. Google según parece utiliza cookies como parte de su protocolo para determinar si rechaza el servicio o bien no.
En junio de 2009, después de la muerte de la superestrella del pop, apareció este mensaje a muchos usuarios de internet que buscaba en Google las noticias relacionadas con el cantante y fue asumido por Google que fue un ataque DDoS, si bien muchas preguntas fueron presentadas por motores de búsqueda legítimos.
5.1) Error de software en el primer mes del año de 2009
Google etiqueta resultados de búsqueda con el mensaje "Este lugar puede dañar tu equipo" si el lugar es conocido por instalar software malicioso. Google hace esto para resguardar a los usuarios que visiten este género de sitios web. Por más o menos 40 minutos el 31 de enero de 2009, todos y cada uno de los resultados de búsquedas fueron clasificados erróneamente como malware y por lo tanto, no se podía hacer click en él. En su sitio, aparecía un mensaje de aviso al usuario y era requerido que el usuario introdujese la dirección URL solicitada de forma manual. Este inconveniente fue causado por un fallo humano. La dirección URL de "/" (que se expande a todas y cada una de las URLs) fue agregado por error en el archivo de patrones de malware.
Back to top6) Internacional
Google está disponible en muchos idiomas y ha sido modificado por completo o en parte, para muchos países.
La interfaz también ha sido puesta a disposición en varios idiomas con fines humorísticos:
- Bork, bork, bork!
- Elmer Gruñón
- Leetspeak
- Klingon
- Pig Latin
- Pirata
6.1) Nombres de dominio
Además de la URL Google.com primordial, Google Inc. posee ciento sesenta nombres de dominio para cada uno de ellos de los países/regiones para las que se ha cambiado.
Back to top