Busquedas en internet
20.12.03
 
La terminología que usa el buscador en internet
En searchlores.org hicieron una página con la terminología que usa el buscador en internet: FRAVIA'S SEEKERS TERMINOLOGY - TIDBITS OF WISDOM

Además dice que no le gustan los weblogs. ¿Lo perdonamos?.

Daniel
17.12.03
 
Nueva funcion buscar en libros de Google

Hace un tiempo amazon.com lanzó la función de búsqueda dentro de libros.



Ya se venía diciendo que Google.com estaba implementando algo similar.



Ya se puede acceder a BOOK - BETA

http://print.google.com/print/faq.html







Google mostrará en sus resultados [BOOK - BETA] cuando haya acceso a texto de un libro.



La búsqueda se puede acotar a resultados son texto.



ej



si busco algo de harold bloom



pongo: harold bloom site:print.google.com



obtengo entre otros:



[BOOK - BETA] Hamlet - Harold Bloom (Excerpt)

Hamlet: Poem Unlimited. by Harold Bloom, Riverhead Books Copyright © 2003.

Buy Hamlet at: ? Amazon. ? Barnes & Noble.com. ? Books-A-Million. ...

http://print.google.com/print/doc?isbn=157322233X - Similar pages



noten isbn=157322233X que es claro el ISBN



La página da un breve texto (excerpt)



15.12.03
 
búsquedas en ftp
Escrito por Tovarich en nuestra lista de discusión


xxx+yyy=términos de búsqueda

PKU [http://bingle.pku.edu.cn/enindex.htm]
http://bingle.pku.edu.cn/scripts/ftp_search.exe?word=xxx+yyy

KIEV FTPSEARCH
http://www.ftpsearch.kiev.ua:8002/ftpsearch?query=xxx+yyy&hits=50&doit=%C7%ED%E0%E9%F2%E8%21
(hits=resultados)

RAMBLER-FTP
http://ftpsearch.rambler.ru/db/ftpsearch/search.html?words=xxx+yyy

FILESEARCHhttp://www.filesearch.ru/cgi-bin/s?q=xxx+yyy&m=40
(m=resultados)

Todos estos poseen una versión de búsqueda avanzada, que pese a
encontrarse en ruso o chino pueden entenderse.

4.12.03
 
Las páginas web suelen desaparecer...
No es una paráfrasis de Charly García y los dinosaurios...

Como si necesitara un ejemplo de lo dicho en el post sobre La evanescencia de las fuentes en Internet (cultura lábil) me encuentro con que el link a http://www4.law.cornell.edu/uscode/17/107.text.html donde se habla del "Fair Use" o uso justo de material publicado en Internet, no funciona, la página ha sido movida o quitada. la misma trataba sobre la "section 107 of the US Copyright Law".


Daniel
 
La evanescencia de las fuentes en Internet (cultura lábil)
Esta es una nota importante y se relaciona con el post anterior sobre cómo citar fuentes de Internet.

Lo que dice es que hicieron un estudio de diferentes artículos que citan páginas de Internet y encontraron un alarmante porcentaje de páginas que habían desaparecido (las páginas viven en promedio 100 días). Por otras fuentes me he enterado de que páginas como supuestamente las de nytimes cambian de URL, tal vez para obligar a visitar la portada, ya sabemos que muchos sitios han protestado por lo que se denomina "deep linking", es decir los enlaces o vínculos (links) directos a páginas dentro de un sitio web o incluso a archivos (además de lo que ya sabemos de que usar imágenes desde otro servidor "roba" ancho de banda, que debe pagar el sitio original).

Por eso el artículo afirma que de esta manera no se puede construir una "cultura". Agrego que también va en contra de lograr que publicar en Internet o citar fuentes de Internet tome carácter serio o académico.

Claro que están los caché de Google y otros buscadores y archive.org, pero no es conveniente. Incluso hay proyectos de nuevas formas de localización de las páginas web más dinámicos que el URL o los DNS.

Creo que es un tema para prestarle atención.

Mientras tanto, conviene guardar en nuestro HD todo material que sea importante, no sólo hacer bookmarks (¿cómo se dice en nuestra lengua?).

Tal vez hacer un mirror (espejo) de la página sea útil, aunque no en todo caso legal o de acuerdo al copyright del sitio original. En algunos casos sin embargo (tal vesz usando rproducciones parciales o completas y siempre citando la fuente), creo que podría aducirse Fair Use.

Otro tema relacionado es todo lo que se discute sobre "copyright", "copyleft", nuevos tipos de licencia como las de "Creative Commons", por no hablar de GPL, GNU, software libre, etc.

Brevemente, creo que producir información cuesta al menos trabajo y todo trabajo debe ser respetado y reconocido (no me convencen mucho algunos depredadores que se disfrazan de hacker o libertarios). Pero también hay que revisar la conveniencia de las formas de circulación de la información, aún para los mismos autores, que muchas veces son los menos beneficiados por los copyright (ej. discográficas).


THE VANISHING WEB: 'NO WAY TO RUN A CULTURE'
A new study published in the journal Science looked at footnotes from scientific articles in three major journals (the New England Journal of Medicine, Science, and Nature) at 3 months, 15 months and 27 months after publication, and found that the prevalence of inactive Internet references grew during those intervals from 3.8% to 10% to 13%. In another recent study, one-fifth of the Internet addresses used in a Web-based high school science curriculum disappeared over 12 months, and a third study found that 40% to 50% of the URLs referenced in articles in two computing journals were inaccessible within four years. Brewster Kahle, widely admired for his creation of the Internet Archive project, says: "It's a huge problem. The average lifespan of a Web page today is 100 days. This is no way to run a culture." (Washington Post 24 Nov 2003)
http://www.washingtonpost.com/wp-dyn/articles/A8730-2003Nov23.html


Via ShelfLife, No. 135 (December 4 2003)
http://www.rlg.org


Daniel
 
Busquedas de extensiones: "The File extension source"
Por tovarich escrito en nuestra lista de discusión

Base de datos que cuenta en la actualidad con cerca de 14367 entradas
que asocian una extensión son el software o aplicación que permite
ejecutarlo. Ejemplo: una búsqueda de HTML luce así:

http://filext.com/detaillist.php?extdetail=HTML&Submit2=Go%21

Permite también acceso a sus records en forma alfabetica, numérica o por
símbolos: http://filext.com