Registros duplicados.
Si tuvierais un fichero de texto (tipo txt) con más un millón de registros en el que tuviérais que buscar registros duplicados, ¿cómo lo harías?
Por ejemplo, tienes un fichero con las facturas mensuales de una empresa de telefonía, en el que cada registro del fichero está formado por nº de factura, cliente e importe y quieres comprobar que no le vas a facturar a un mismo cliente dos veces.
Y no me refiero de forma teórica sino qué programa de vuestro PC y qué pasos seguirías para encontrar los duplicados.
5 comentarios:
Lo primero que se me ha ocurrido es: si tienes instalado en el ordenador un servidor, por ejemplo wampserver (apache, mysql, php), haces una página e introduces el archivo .txt en la base de datos. luego con algún query puedes encontrar las entradas duplicadas de varias formas con tablas y campos. Pero vamos, que seguro que esta es la forma más complicada de hacerlo. También se me ocurre con excel, aunque habría que pensarlo un poco.
Con excel no podrías ya que como máximo admite unas 65000 líneas, de hecho, en eso reside el problema, en que no puede utilzarse excel u otra hoja de cálculo.
En cualquier caso te aseguro que con un PC normal con windows y office puede hacerse, sin necesidad de servidor.
Premio para el caballero, como se notan los genes, efectivamente probablemente la mejor forma de hacerlo es utilizando access.
Yo, lo que he hecho ya un par de veces (en la oficina cada vez que alguien tiene que hacer algo de esto me pregunta a mi) fue crear un programilla con visual basic (el de excel y access no el profesional) que me ordena el fichero por la columna en la que buscas los duplicados y luego lo recorre buscando duplicados adyacentes.
Sin duda menos elegante (y probablemente menos eficiente) que utilizar access y una consulta SQL.
That's a great story. Waiting for more. » » »
Enjoyed a lot! Lexus ls430 steering wheel cover training online camouflage pants men who wear a bra phentermine video surveillance
Publicar un comentario