tag:blogger.com,1999:blog-2122907654784586589.post1252027566475894163..comments2022-03-27T20:03:14.992-03:00Comments on O Peczenyj: Identificando linhas repetidas em varios arquivosTiago "PacMan" Peczenyjhttp://www.blogger.com/profile/14804218844671345695noreply@blogger.comBlogger3125tag:blogger.com,1999:blog-2122907654784586589.post-42557543252757459412007-07-27T15:43:00.000-03:002007-07-27T15:43:00.000-03:00Denis, mantive os seus dois comentarios, apesar de...Denis, mantive os seus dois comentarios, apesar de serem semelhantes.<BR/><BR/>Saca só, se pensarmos em 16 milhões de linhas, temos q pensar exatamente no que queremos. se for para encontrar as linhas exatas, talvez o grep seja mais rápido, porém acredito que vai ter muito acesso a disco.<BR/><BR/>Se separarmos os arquivos em partes, de acordo com os caracteres iniciais, acho que a pesquisa pode ficar bem mais rapida -- se estiverem ordenados então vai q é um tapa.<BR/><BR/>Ou talvez seja o momento de pensar em algoritmos mais complexos :)Tiago "PacMan" Peczenyjhttps://www.blogger.com/profile/14804218844671345695noreply@blogger.comtag:blogger.com,1999:blog-2122907654784586589.post-27895719933814110472007-07-27T02:09:00.000-03:002007-07-27T02:09:00.000-03:00Imagino que para um busca menor de 16milhoes a mel...Imagino que para um busca menor de 16milhoes a melhor seria o grep, pois nao utiliza os redirects como no caso do UNIQ.Unknownhttps://www.blogger.com/profile/15195328443082980259noreply@blogger.comtag:blogger.com,1999:blog-2122907654784586589.post-79312444247519252462007-07-27T02:08:00.000-03:002007-07-27T02:08:00.000-03:00Imagino que para um busca menor de 16milhoes a mel...Imagino que para um busca menor de 16milhoes a melhor seria o grep, pois nao utiliza os redirects como no caso do SORT. Se nao o AWK.Unknownhttps://www.blogger.com/profile/15195328443082980259noreply@blogger.com