{"id":380,"date":"2006-08-16T08:19:18","date_gmt":"2006-08-16T07:19:18","guid":{"rendered":"http:\/\/changlonet.com\/blog\/2006\/lidiando-con-grandes-cantidades-de-datos-%c2%bfestamos-preparados\/"},"modified":"2006-08-16T08:19:18","modified_gmt":"2006-08-16T07:19:18","slug":"lidiando-con-grandes-cantidades-de-datos-estamos-preparados","status":"publish","type":"post","link":"https:\/\/changlonet.com\/blog\/lidiando-con-grandes-cantidades-de-datos-estamos-preparados\/","title":{"rendered":"Lidiando con grandes cantidades de datos \u00bfestamos preparados?"},"content":{"rendered":"<p>\t\t\t\tTen\u00eda pendiente de comentar <a target=\"_blank\" href=\"http:\/\/mnm.uib.es\/gallir\/posts\/2006\/08\/07\/794\/\" rel=\"noopener noreferrer\">una entrada del Blog de Ricardo Gall<\/a>i, donde cuenta que Google va a liberar una enorme cantidad de datos sobre secuencias de palabras en sus archivos de b\u00fasquedas. Ricardo se plantea desde el punto de vista de su profesi\u00f3n, si en las Universidades espa\u00f1olas estamos preparados para formar especialistas en estos temas y tambi\u00e9n apunta como el tratamiento de un volumen de datos tan grandes puede suponer un cambio de paradigma en la inform\u00e1tica, que pasar\u00eda de ser precisa y simplifacadora a lo contrario (imagino que imprecisa y compleja).<\/p>\n<p>Parece que las m\u00e1quinas estar\u00edan preparadas para enfrentarse a tales vol\u00famenes de datos, los profesionales de la inform\u00e1tica, no lo tengo claro, pero los usuarios finales si que no est\u00e1n preparados para eso. Yo llevo una temporada lidiando con grandes vol\u00famenes de datos y es curioso como mucha gente no termina de entender qu\u00e9 es lo que tienes en tu PC, tienes toda la informaci\u00f3n de la empresa sobre un determinado punto. Y as\u00ed hay un mont\u00f3n de informaci\u00f3n que ni se trata ni se tratar\u00e1, porque no se es consciente de que est\u00e1 ah\u00ed esa informaci\u00f3n. Solo pongo un ejemplo tonto, podemos obtener la informaci\u00f3n de operaciones que hacen los clientes en cada sucursal, intrdozcase en un sistema geogr\u00e1fico (vamos, trasl\u00e1dese a un mapa) y veamos las rutas que hacen los clientes para usar distintos servicios: vuelven en el mismo d\u00eda a la misma oficina para realizar la misma gesti\u00f3n?, van a otra al lado?, podemos encontrar ubicaciones para las Oficinas m\u00e1s c\u00f3modas, es decir en lugares de paso de los clientes, para ahorrarles desplazamientos.<\/p>\n<p>Cuesta hacer entender a los usuarios el concepto de tendencia, (algunos deber\u00edan leer La Fundaci\u00f3n de Asimov, a ver si se hacen un s\u00edmil con la Psicohistoria) y se empe\u00f1an en usar sistemas de Datawarehouse para pedir informaci\u00f3n sobre clientes muy concretos, en lugar de usar las l\u00edneas gruesas, buscan el puntito concreto.<\/p>\n<p>Luego sobre el tema de la precisi\u00f3n, cuando manejas datos en grandes cantidades es divertido ver como aquello que cre\u00edas preciso, se revela como impreciso, vamos que un algoritmo que no deb\u00eda de fallar nunca, al final cuando lo enfrentas a millones de operaciones en muchos sitios y con much\u00edsimos clientes diferentes, al final falla.<\/p>\n<p>Y al final hace falta el traductor, alguien que sea capaz de entender la complejidad de los datos, la manera en que se introdujeron en el sistema y su verdadera relevancia.<\/p>\n<p>As\u00ed que en la mayor\u00eda de empresas tradicionales no se est\u00e1 preparado hoy en d\u00eda para tratar grandes cantidades de informaci\u00f3n, as\u00ed que las Universidades&#8230;\t\t<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ten\u00eda pendiente de comentar <a target=\"_blank\" href=\"http:\/\/mnm.uib.es\/gallir\/posts\/2006\/08\/07\/794\/\" rel=\"noopener noreferrer\">una entrada del Blog de Ricardo Gall<\/a>i, donde cuenta que Google va a liberar una enorme cantidad de datos sobre secuencias de palabras en sus archivos de b\u00fasquedas.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[10,13],"tags":[],"series":[],"class_list":["post-380","post","type-post","status-publish","format-standard","hentry","category-otras-cosas","category-software"],"_links":{"self":[{"href":"https:\/\/changlonet.com\/blog\/wp-json\/wp\/v2\/posts\/380","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/changlonet.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/changlonet.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/changlonet.com\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/changlonet.com\/blog\/wp-json\/wp\/v2\/comments?post=380"}],"version-history":[{"count":0,"href":"https:\/\/changlonet.com\/blog\/wp-json\/wp\/v2\/posts\/380\/revisions"}],"wp:attachment":[{"href":"https:\/\/changlonet.com\/blog\/wp-json\/wp\/v2\/media?parent=380"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/changlonet.com\/blog\/wp-json\/wp\/v2\/categories?post=380"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/changlonet.com\/blog\/wp-json\/wp\/v2\/tags?post=380"},{"taxonomy":"series","embeddable":true,"href":"https:\/\/changlonet.com\/blog\/wp-json\/wp\/v2\/series?post=380"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}