Visa obesvarade inlägg | Visa aktiva trådar Aktuellt datum och tid: 25 nov 2017, 10:45



Svara på tråd  [ 13 inlägg ] 
 Kommando för att radera dubletter i text 
Författare Meddelande

Blev medlem: 26 sep 2007, 19:49
Inlägg: 716
OS: Ubuntu
Svara med citat
Inlägg Kommando för att radera dubletter i text
Vet något ett bra kommando för att radera dubletter av ord, epostadresser etc i en textfil? :)


16 aug 2016, 09:19
Profil
Serveradmin
Användarvisningsbild

Blev medlem: 22 okt 2006, 08:13
Inlägg: 3555
Ort: Svedala
OS: Ubuntu
Utgåva: 17.04 Zesty Zapus
Svara med citat
Inlägg Re: Kommando för att radera dubletter i text
Hhhmm, det beror lite på vad du vill åstadkomma och hur innehållet i texten ser ut.... Men, om du t.ex. har en lista med ord i en fil kallad "textfil" skulle du kunna:

Kod:
cat textfil | uniq | sort


Det ger dig endast unikt förekommande ord i textfilen, och dessutom alfanumeriskt sorterade. Vill du dessutom ha resultatet sparat i en annan fil kan du:

Kod:
cat textfil | uniq | sort  > resultatfil


Det här var bara lite grundläggande exempel, det finns såklart tonvis med varianter.


16 aug 2016, 12:16
Profil WWW

Blev medlem: 26 sep 2007, 19:49
Inlägg: 716
OS: Ubuntu
Svara med citat
Inlägg Re: Kommando för att radera dubletter i text
Nej det funkade inte. Epostlistan har fortfarande dubletterna kvar. Är osäker på om och vad kommandona gjorde. :P


16 aug 2016, 19:59
Profil
Serveradmin
Användarvisningsbild

Blev medlem: 22 okt 2006, 08:13
Inlägg: 3555
Ort: Svedala
OS: Ubuntu
Utgåva: 17.04 Zesty Zapus
Svara med citat
Inlägg Re: Kommando för att radera dubletter i text
Som sagt, mitt exempel utgick från en lista. Du måste vara lite mer beskrivande gällande innehållet i texten annars blir det svårt att lösa.

Sent from my Redmi 3 using Tapatalk


16 aug 2016, 22:16
Profil WWW

Blev medlem: 26 sep 2007, 19:49
Inlägg: 716
OS: Ubuntu
Svara med citat
Inlägg Re: Kommando för att radera dubletter i text
Kommandot ser ut att ta bort vissa dubletter men inte andra. T.e.x i textfilen ser har bl a. dessa adresser på rad:

Citat:
QQQ@hotmail.se
....
....
....
zzzz.www@Yry.se
.....
.....


och resultatfilen har bara en av dessa vilket är som det ska. Med hos andra dubletter är det ingen skillnad. Tex. så har resultatfilen detta:
Citat:
YYY.KKK@TTT.se
.....
.....


vilket inte borde vara fallet.


Senast redigerad av Ainigma 17 aug 2016, 15:12, redigerad totalt 2 gånger.



17 aug 2016, 09:36
Profil

Blev medlem: 23 jan 2009, 13:36
Inlägg: 25
OS: Debian
Svara med citat
Inlägg Re: Kommando för att radera dubletter i text  Tråden är löst
Ainigma skrev:
Kommandot ser ut att ta bort vissa dubletter men inte andra.


uniq tar bara bort intill varandra liggande dubbletter. Pröva med att ändra ordningen till
Kod:
cat textfil | sort | uniq
så att sorteringen utförs först.

(möjligen även med flaggan -i efter uniq för att även ta bort dubbletter oavsett skiftläge)


17 aug 2016, 09:58
Profil

Blev medlem: 26 sep 2007, 19:49
Inlägg: 716
OS: Ubuntu
Svara med citat
Inlägg Re: Kommando för att radera dubletter i text
Ja det blev bättre! Tack så mycket. :)


17 aug 2016, 10:17
Profil
Global Moderator
Användarvisningsbild

Blev medlem: 09 jun 2012, 05:16
Inlägg: 4459
Ort: Boo
OS: Ubuntu
Utgåva: 17.10 Artful Aardvark
Svara med citat
Inlägg Re: Kommando för att radera dubletter i text
Är det bra att posta dessa (eller andra) e-postadresser här? :-\

_________________
Artful Aardvark 64-bit | Chrome 63β | HTTPS Everywhere | Privacy Badger


17 aug 2016, 10:34
Profil

Blev medlem: 26 sep 2007, 19:49
Inlägg: 716
OS: Ubuntu
Svara med citat
Inlägg Re: Kommando för att radera dubletter i text
Epostadresserna är offentliga adresser till organisationer så det ska väl inte vara ett problem. :P


17 aug 2016, 11:56
Profil
Global Moderator
Användarvisningsbild

Blev medlem: 09 jun 2012, 05:16
Inlägg: 4459
Ort: Boo
OS: Ubuntu
Utgåva: 17.10 Artful Aardvark
Svara med citat
Inlägg Re: Kommando för att radera dubletter i text
De tar nog med glädje emot mer spam. :P

_________________
Artful Aardvark 64-bit | Chrome 63β | HTTPS Everywhere | Privacy Badger


17 aug 2016, 14:06
Profil

Blev medlem: 26 sep 2007, 19:49
Inlägg: 716
OS: Ubuntu
Svara med citat
Inlägg Re: Kommando för att radera dubletter i text
Förstår piken fast den var fin ;) . . tror dock inte att spamprogram hittar epostadresserna lättare här än på de webbsidor där epostadresser ursprungligen hämtats så jag vidhåller att det inte borde vara ett problem. Men om admin tror att det kan bli ett problem eller att det är olämpligt så får han/hon gärna ta bort tråden. Jag har ju fått mitt problem löst så det spelar ju ingen roll för mig om det tas bort. Såvitt jag förstår så kan inte jag ta bort inlägget. :)


17 aug 2016, 14:51
Profil
Global Moderator
Användarvisningsbild

Blev medlem: 09 jun 2012, 05:16
Inlägg: 4459
Ort: Boo
OS: Ubuntu
Utgåva: 17.10 Artful Aardvark
Svara med citat
Inlägg Re: Kommando för att radera dubletter i text
Du kan redigera dina inlägg. :idea:

_________________
Artful Aardvark 64-bit | Chrome 63β | HTTPS Everywhere | Privacy Badger


17 aug 2016, 15:01
Profil

Blev medlem: 26 sep 2007, 19:49
Inlägg: 716
OS: Ubuntu
Svara med citat
Inlägg Re: Kommando för att radera dubletter i text
aha, var det så enkelt . . det är alltså redigera knappen vid varje inlägg . . :O , okej då fixar jag det. :!:


17 aug 2016, 15:09
Profil
Visa inlägg nyare än:  Sortera efter  
Svara på tråd   [ 13 inlägg ] 

Vilka är online

Användare som besöker denna kategori: Inga registrerade användare och 1 gäst


Du kan inte skapa nya trådar i denna kategori
Du kan inte svara på trådar i denna kategori
Du kan inte redigera dina inlägg i denna kategori
Du kan inte ta bort dina inlägg i denna kategori
Du kan inte bifoga filer i denna kategori

Sök efter:
Hoppa till:  
cron
Main Engineer for phpBB3: Bertie at phpBB.com © 2000 - 2002, 2005 - 2007, the Group behind the Open Source code of phpBB.
Designed by STSoftware, modified by Katt, Konservburk & Peetra. Swedish translation by Peetra & phpBB Sweden © 2006-2011