Comments on O Peczenyj: Identificando linhas repetidas em varios arquivos

Denis, mantive os seus dois comentarios, apesar de...

2007-07-27T15:43:00.000-03:00

Denis, mantive os seus dois comentarios, apesar de serem semelhantes.

Saca só, se pensarmos em 16 milhões de linhas, temos q pensar exatamente no que queremos. se for para encontrar as linhas exatas, talvez o grep seja mais rápido, porém acredito que vai ter muito acesso a disco.

Se separarmos os arquivos em partes, de acordo com os caracteres iniciais, acho que a pesquisa pode ficar bem mais rapida -- se estiverem ordenados então vai q é um tapa.

Ou talvez seja o momento de pensar em algoritmos mais complexos :)

Imagino que para um busca menor de 16milhoes a mel...

2007-07-27T02:09:00.000-03:00

Imagino que para um busca menor de 16milhoes a melhor seria o grep, pois nao utiliza os redirects como no caso do UNIQ.

Imagino que para um busca menor de 16milhoes a mel...

2007-07-27T02:08:00.000-03:00

Imagino que para um busca menor de 16milhoes a melhor seria o grep, pois nao utiliza os redirects como no caso do SORT. Se nao o AWK.