Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les r�ponses en temps r�el, voter pour les messages, poser vos propres questions et recevoir la newsletter

Autres Logiciels Discussion :

Trouver des doublons dans un pdf


Sujet :

Autres Logiciels

  1. #1
    Membre �prouv�
    Homme Profil pro
    Analyse syst�me
    Inscrit en
    Juin 2013
    Messages
    976
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pas de Calais (Nord Pas de Calais)

    Informations professionnelles :
    Activit� : Analyse syst�me
    Secteur : High Tech - Multim�dia et Internet

    Informations forums :
    Inscription : Juin 2013
    Messages : 976
    Par d�faut Trouver des doublons dans un pdf
    Bonjour,
    connaissez vous un logiciel permettant de trouver des doublons dans un fichier pdf?

    Par exemple, j'ai un fichier qui fais environ 500 pages, chaque document concerne un salari� et correspond � deux pages ( recto verso). Dans chaque page on a le nom prenom et donn�es du salari� ainsi que son identifiant.

    Je souhaiterais savoir s'il existe un logiciel permettant de trouver les doublon c'est � dire, me disant que jacques Dupont (identifiant 123456) se trouve �galement en page 100, 150 et 250 )?

    Est ce possible?
    Merci beaucoup

  2. #2
    Membre chevronn�
    Profil pro
    Inscrit en
    Mai 2007
    Messages
    351
    D�tails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2007
    Messages : 351
    Par d�faut
    Bonsoir,

    A condition de disposer de Adobe Acrobat, il existe un plugin appel� AutoSplit qui permet de r�p�rer les pages en doublons et de les �liminer.

  3. #3
    doc
    doc est d�connect�
    Membre exp�riment�

    Profil pro
    Inscrit en
    Ao�t 2002
    Messages
    107
    D�tails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Ao�t 2002
    Messages : 107
    Par d�faut
    Puisque vous programmez en .net, Itext7 permet de chercher facilement un mot ou un groupe de mot dans un fichier pdf, et de reporter les pages en question

    Le snippet ci-dessous est copi� de stack overflow https://stackoverflow.com/questions/58429089/searching-for-a-keyword-in-pdf-using-itextsharp-7

    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    public List<int> ReadPdfFile(String fileName, String searthText)
    {
        List<int> pages = new List<int>();
        if (File.Exists(fileName))
        {
            using (PdfReader pdfReader = new PdfReader(fileName))
            using (PdfDocument pdfDocument = new PdfDocument(pdfReader))
            {
                for (int page = 1; page <= pdfDocument.GetNumberOfPages(); page++)
                {
                    ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
    
                    string currentPageText = PdfTextExtractor.GetTextFromPage(pdfDocument.GetPage(page), strategy);
                    if (currentPageText.Contains(searthText))
                    {
                        pages.Add(page);
                    }
                }
            }
        }
        return pages;
    }

    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  4. #4
    Membre �prouv�
    Homme Profil pro
    Analyse syst�me
    Inscrit en
    Juin 2013
    Messages
    976
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pas de Calais (Nord Pas de Calais)

    Informations professionnelles :
    Activit� : Analyse syst�me
    Secteur : High Tech - Multim�dia et Internet

    Informations forums :
    Inscription : Juin 2013
    Messages : 976
    Par d�faut
    Bonjour ,
    merci pour ce retour
    je vais �tudioer cela *

+ R�pondre � la discussion
Cette discussion est r�solue.

Discussions similaires

  1. R�ponses: 4
    Dernier message: 12/03/2015, 11h46
  2. Trouver des doublons dans une 2eme table
    Par hammag dans le forum SQL
    R�ponses: 2
    Dernier message: 13/08/2013, 17h04
  3. [COM] Trouver des mots dans des PDF et autres documents ?
    Par zyongh dans le forum Biblioth�ques et frameworks
    R�ponses: 2
    Dernier message: 02/11/2006, 14h23
  4. Gestion des Fonts dans le PDF
    Par JMLD dans le forum XMLRAD
    R�ponses: 4
    Dernier message: 05/08/2005, 11h09
  5. Eliminer des Doublon dans une Table
    Par Soulama dans le forum MS SQL Server
    R�ponses: 5
    Dernier message: 03/02/2005, 14h27

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo