Aankondiging

Collapse
No announcement yet.

Mailadressen inPDF bestand

Collapse
X
 
  • Filter
  • Tijd
  • Show
Clear All
new posts

  • Mailadressen inPDF bestand

    Goed, vraagje voor de echte kenners.
    Ik heb dus een back-up kunnen maken van mijn klantenbestand, alleen, die back-up is in pdf-formaat.
    14.000 pagina's in n pdf, en op iedere pagina gegevens van 1 klant, inclusief mailadres.
    Nu wil ik graag al die mailadressen in n bestandje hebben waar ik wl wat mee kan.
    Iemand enig idee hoe ik dat voor elkaar kan krijgen????
    Those are my principles, and if you don't like them... well, I have others

  • #2
    Kun je de tekst wel selecteren?
    Zo ja, kopieren/plakken in word en exporteren naar Excel, beetje handige filteren of formuletje bedenken en klaar.

    Comment


    • #3
      scannen met tekstherkenning?
      Het is verontrustend dat de enige zekerheid in ons leven (dat we doodgaan) nog steeds niet empirisch is bewezen voor iedereen.
      Het licht aan het einde van de tunnel is een aanstormende trein

      Comment


      • #4
        Als het zoveel adressen zijn is het vast selecteerbaar, welke reader gebruik je?
        $ (cat - 2>&1 ) > /dev/null

        Comment


        • #5
          Ik heb acrobat reader 7.0,die helaas vastslaat bij <ctrl-A>. Blijkbaar toch een beetje te groot document.
          Zou leukzijn om een tooltje te hebben die dit soort dingen automatisch kan. Via google kom ik alleen progjes tegen die mailadressen harvesten vanaf het internet.
          Those are my principles, and if you don't like them... well, I have others

          Comment


          • #6
            Google-en op OCR en kiezen maar.
            $ (cat - 2>&1 ) > /dev/null

            Comment


            • #7
              Acrobat Reader heeft toch een export-naar-txt-functie?

              Dan heb je de hele zwik in een .txt-bestandje.

              Vervolgens zo'n harvester-programmaatje erop loslaten, klaar (desnoods vooraf het txt-bestand even naar een html-bestandje converteren).
              Op dag 8 schiep God de tie-wrap en de duct tape. En God keek en zag dat het goed was.

              Comment


              • #8
                Of openen in illustrator en dan saven als txt?

                Comment


                • #9
                  In je pdf reader opslaan als txt. Belangrijk is ook om de bijbehorende naam in je uiteindelijke betsand te krijgen (lagere spam score mailing, optie om naam in mailing te gebruiken etc).

                  Het uiteindelijk txt bestand kan je met bv een eigengemaakt applescript weer laten opslaan tot cvs (je weet na zien van txt bestand immers waar de kolommen zich bevinden) met opmaak "email";"naam"\n. Die kan je weer gebruiken in je html mass mailing tool.

                  Succes

                  Comment


                  • #10
                    Even zoeken op i-net. Er zijn gratis PDF naar Word programmaatjes beschikbaar. Zoeken op PDF to Word bijvoorbeeld ;-)
                    Kawa Versys 2010 MX-5 nc White up!

                    Comment


                    • #11
                      k heb het nu tot .txt bestand kunnen omtoveren (thnx. squadra), nu nog de mailadressen eruit filteren.
                      Those are my principles, and if you don't like them... well, I have others

                      Comment


                      • #12
                        sed '/\@/s/ *(.*)//; s/>.*//; s/.*[:<] *//'
                        $ (cat - 2>&1 ) > /dev/null

                        Comment


                        • #13
                          Indien je alleen wil filteren op @ ben je inderdaad makkelijk klaar (ervanuitgaan dat de naam en email is opgeslagen als klikbare link maar dat denk ik eerlijk gezegd niet, in voorbeeld hieronder ga ik ervan uit dat die apart in de tabel van je stonden). Ik zou dus even je tekst bestand openen in notepad en kijken waardoor de kolommen worden gescheiden. Op basis van dat scheidingspatroon kan je heel makkelijk de juiste kolommen eruit pakken, enige dat verneukt zal zijn gok ik is je karakterset.

                          Nogmaals met beetje scripting ben je nu zo klaar, stel het wordt gescheiden door drie spaties en de rijen door een enter dan maak je bv in php een upload tooltje die bestand afvangt en verwerkt. Hier even iets dat ik snel kon knippen en plakken (voor beeldvorming: bestand declareren, bestand verplaatsen, bestand inlezen, kolomen filteren (hier scheidingsteken ;) juiste eruit vissen en wegschrijven of echoen:

                          Code:
                          $ftmp = $_FILES['bestand']['tmp_name'];
                          $fname = $_FILES['bestand']['name'];
                          
                          move_uploaded_file($ftmp , "$root"."/tmp/"."$fname"."");
                          $rsFileContents = file("$root"."/tmp/"."$fname"."");
                          
                          $i=count($rsFileContents);
                          $x=0;
                          
                          While($x<$i) {
                          
                          $eco_sku = '';
                          $eco_aantal = '';
                          
                          $eco_explode= explode(";",$rsFileContents[$x]);  
                          $eco_sku = $eco_explode[0];  
                          $eco_aantal= $eco_explode[6]; 
                          
                          echo "$eco_sku - $eco_aantal<br />\n";
                          
                                 $x++;
                             }
                          
                          unlink("$root"."/tmp/"."$fname"."");
                          
                          echo "<p>Verwerkte regels: $i</p>";
                          Last edited by squadracorse; 02-10-08, 13:03.

                          Comment

                          Working...
                          X