kill traces of ltk, incorporate new sources

[evince.git] / pdf / xpdf / XRef.cc
diff --git a/pdf/xpdf/XRef.cc b/pdf/xpdf/XRef.cc

index c725a4a3c74d3b9c9d5bb38ee070336a49343cb3..901caa596b3acd7cb9f56a28e8e4a1406664046a 100644 (file)
--- a/pdf/xpdf/XRef.cc
+++ b/pdf/xpdf/XRef.cc
@@ -2,11 +2,13 @@
  //
  // XRef.cc
  //
-// Copyright 1996 Derek B. Noonburg
+// Copyright 1996-2002 Glyph & Cog, LLC
  //
  //========================================================================
  
-#ifdef __GNUC__
+#include <aconf.h>
+
+#ifdef USE_GCC_PRAGMAS
  #pragma implementation
  #endif
  
@@ -20,7 +22,11 @@
  #include "Lexer.h"
  #include "Parser.h"
  #include "Dict.h"
+#ifndef NO_DECRYPTION
+#include "Decrypt.h"
+#endif
  #include "Error.h"
+#include "ErrorCodes.h"
  #include "XRef.h"
  
  //------------------------------------------------------------------------
@@ -28,40 +34,43 @@
  #define xrefSearchSize 1024    // read this many bytes at end of file
                                 //   to look for 'startxref'
  
+#ifndef NO_DECRYPTION
  //------------------------------------------------------------------------
-// The global xref table
+// Permission bits
  //------------------------------------------------------------------------
  
-XRef *xref = NULL;
+#define permPrint    (1<<2)
+#define permChange   (1<<3)
+#define permCopy     (1<<4)
+#define permNotes    (1<<5)
+#define defPermFlags 0xfffc
+#endif
  
  //------------------------------------------------------------------------
  // XRef
  //------------------------------------------------------------------------
  
-XRef::XRef(Stream *str1) {
-  XRef *oldXref;
-  int pos;
+XRef::XRef(BaseStream *strA, GString *ownerPassword, GString *userPassword) {
+  Guint pos;
    int i;
  
    ok = gTrue;
+  errCode = errNone;
    size = 0;
    entries = NULL;
-
-  // get rid of old xref (otherwise it will try to fetch the Root object
-  // in the new document, using the old xref)
-  oldXref = xref;
-  xref = NULL;
+  streamEnds = NULL;
+  streamEndsLen = 0;
  
    // read the trailer
-  str = str1;
+  str = strA;
    start = str->getStart();
-  pos = readTrailer(str);
+  pos = readTrailer();
  
    // if there was a problem with the trailer,
    // try to reconstruct the xref table
    if (pos == 0) {
-    if (!(ok = constructXRef(str))) {
-      xref = oldXref;
+    if (!(ok = constructXRef())) {
+      errCode = errDamaged;
        return;
      }
  
@@ -69,10 +78,10 @@ XRef::XRef(Stream *str1) {
    } else {
      entries = (XRefEntry *)gmalloc(size * sizeof(XRefEntry));
      for (i = 0; i < size; ++i) {
-      entries[i].offset = -1;
+      entries[i].offset = 0xffffffff;
        entries[i].used = gFalse;
      }
-    while (readXRef(str, &pos)) ;
+    while (readXRef(&pos)) ;
  
      // if there was a problem with the xref table,
      // try to reconstruct it
@@ -80,20 +89,24 @@ XRef::XRef(Stream *str1) {
        gfree(entries);
        size = 0;
        entries = NULL;
-      if (!(ok = constructXRef(str))) {
-       xref = oldXref;
+      if (!(ok = constructXRef())) {
+       errCode = errDamaged;
         return;
        }
      }
    }
  
-  // set up new xref table
-  xref = this;
+  // now set the trailer dictionary's xref pointer so we can fetch
+  // indirect objects from it
+  trailerDict.getDict()->setXRef(this);
  
    // check for encryption
-  if (checkEncrypted()) {
+#ifndef NO_DECRYPTION
+  encrypted = gFalse;
+#endif
+  if (checkEncrypted(ownerPassword, userPassword)) {
      ok = gFalse;
-    xref = oldXref;
+    errCode = errEncrypted;
      return;
    }
  }
@@ -101,21 +114,25 @@ XRef::XRef(Stream *str1) {
  XRef::~XRef() {
    gfree(entries);
    trailerDict.free();
+  if (streamEnds) {
+    gfree(streamEnds);
+  }
  }
  
  // Read startxref position, xref table size, and root.  Returns
  // first xref position.
-int XRef::readTrailer(Stream *str) {
+Guint XRef::readTrailer() {
    Parser *parser;
    Object obj;
    char buf[xrefSearchSize+1];
-  int n, pos, pos1;
+  int n;
+  Guint pos, pos1;
    char *p;
    int c;
    int i;
  
    // read last xrefSearchSize bytes
-  str->setPos(-xrefSearchSize);
+  str->setPos(xrefSearchSize, -1);
    for (n = 0; n < xrefSearchSize; ++n) {
      if ((c = str->getChar()) == EOF)
        break;
@@ -131,7 +148,7 @@ int XRef::readTrailer(Stream *str) {
    if (i < 0)
      return 0;
    for (p = &buf[i+9]; isspace(*p); ++p) ;
-  pos = atoi(p);
+  pos = lastXRefPos = strToUnsigned(p);
  
    // find trailer dict by looking after first xref table
    // (NB: we can't just use the trailer dict at the end of the file --
@@ -166,7 +183,9 @@ int XRef::readTrailer(Stream *str) {
  
    // read trailer dict
    obj.initNull();
-  parser = new Parser(new Lexer(str->subStream (start + pos1, -1, &obj)));
+  parser = new Parser(NULL,
+            new Lexer(NULL,
+              str->makeSubStream(start + pos1, gFalse, 0, &obj)));
    parser->getObj(&trailerDict);
    if (trailerDict.isDict()) {
      trailerDict.dictLookupNF("Size", &obj);
@@ -193,12 +212,12 @@ int XRef::readTrailer(Stream *str) {
  }
  
  // Read an xref table and the prev pointer from the trailer.
-GBool XRef::readXRef(Stream *str, int *pos) {
+GBool XRef::readXRef(Guint *pos) {
    Parser *parser;
    Object obj, obj2;
    char s[20];
    GBool more;
-  int first, n, i, j;
+  int first, newSize, n, i, j;
    int c;
  
    // seek to xref in stream
@@ -210,65 +229,101 @@ GBool XRef::readXRef(Stream *str, int *pos) {
    s[1] = (char)str->getChar();
    s[2] = (char)str->getChar();
    s[3] = (char)str->getChar();
-  if (!(s[0] == 'x' && s[1] == 'r' && s[2] == 'e' && s[3] == 'f'))
+  if (!(s[0] == 'x' && s[1] == 'r' && s[2] == 'e' && s[3] == 'f')) {
      goto err2;
+  }
  
    // read xref
    while (1) {
-    while ((c = str->lookChar()) != EOF && isspace(c))
+    while ((c = str->lookChar()) != EOF && isspace(c)) {
        str->getChar();
-    if (c == 't')
+    }
+    if (c == 't') {
        break;
-    for (i = 0; (c = str->getChar()) != EOF && isdigit(c) && i < 20; ++i)
+    }
+    for (i = 0; (c = str->getChar()) != EOF && isdigit(c) && i < 20; ++i) {
        s[i] = (char)c;
-    if (i == 0)
+    }
+    if (i == 0) {
        goto err2;
+    }
      s[i] = '\0';
      first = atoi(s);
-    while ((c = str->lookChar()) != EOF && isspace(c))
+    while ((c = str->lookChar()) != EOF && isspace(c)) {
        str->getChar();
-    for (i = 0; (c = str->getChar()) != EOF && isdigit(c) && i < 20; ++i)
+    }
+    for (i = 0; (c = str->getChar()) != EOF && isdigit(c) && i < 20; ++i) {
        s[i] = (char)c;
-    if (i == 0)
+    }
+    if (i == 0) {
        goto err2;
+    }
      s[i] = '\0';
      n = atoi(s);
-    while ((c = str->lookChar()) != EOF && isspace(c))
+    while ((c = str->lookChar()) != EOF && isspace(c)) {
        str->getChar();
+    }
+    // check for buggy PDF files with an incorrect (too small) xref
+    // table size
+    if (first + n > size) {
+      newSize = size + 256;
+      entries = (XRefEntry *)grealloc(entries, newSize * sizeof(XRefEntry));
+      for (i = size; i < newSize; ++i) {
+       entries[i].offset = 0xffffffff;
+       entries[i].used = gFalse;
+      }
+      size = newSize;
+    }
      for (i = first; i < first + n; ++i) {
        for (j = 0; j < 20; ++j) {
-       if ((c = str->getChar()) == EOF)
+       if ((c = str->getChar()) == EOF) {
           goto err2;
+       }
         s[j] = (char)c;
        }
-      if (entries[i].offset < 0) {
+      if (entries[i].offset == 0xffffffff) {
         s[10] = '\0';
-       entries[i].offset = atoi(s);
+       entries[i].offset = strToUnsigned(s);
         s[16] = '\0';
         entries[i].gen = atoi(&s[11]);
-       if (s[17] == 'n')
+       if (s[17] == 'n') {
           entries[i].used = gTrue;
-       else if (s[17] == 'f')
+       } else if (s[17] == 'f') {
           entries[i].used = gFalse;
-       else
+       } else {
           goto err2;
+       }
+       // PDF files of patents from the IBM Intellectual Property
+       // Network have a bug: the xref table claims to start at 1
+       // instead of 0.
+       if (i == 1 && first == 1 &&
+           entries[1].offset == 0 && entries[1].gen == 65535 &&
+           !entries[1].used) {
+         i = first = 0;
+         entries[0] = entries[1];
+         entries[1].offset = 0xffffffff;
+       }
        }
      }
    }
  
    // read prev pointer from trailer dictionary
    obj.initNull();
-  parser = new Parser(new Lexer(str->subStream (str->getPos(), -1, &obj)));
+  parser = new Parser(NULL,
+            new Lexer(NULL,
+              str->makeSubStream(str->getPos(), gFalse, 0, &obj)));
    parser->getObj(&obj);
-  if (!obj.isCmd("trailer"))
+  if (!obj.isCmd("trailer")) {
      goto err1;
+  }
    obj.free();
    parser->getObj(&obj);
-  if (!obj.isDict())
+  if (!obj.isDict()) {
      goto err1;
+  }
    obj.getDict()->lookupNF("Prev", &obj2);
    if (obj2.isInt()) {
-    *pos = obj2.getInt();
+    *pos = (Guint)obj2.getInt();
      more = gTrue;
    } else {
      more = gFalse;
@@ -287,31 +342,36 @@ GBool XRef::readXRef(Stream *str, int *pos) {
  }
  
  // Attempt to construct an xref table for a damaged file.
-GBool XRef::constructXRef(Stream *str) {
+GBool XRef::constructXRef() {
    Parser *parser;
    Object obj;
    char buf[256];
-  int pos;
+  Guint pos;
    int num, gen;
    int newSize;
+  int streamEndsSize;
    char *p;
    int i;
    GBool gotRoot;
  
    error(0, "PDF file is damaged - attempting to reconstruct xref table...");
    gotRoot = gFalse;
+  streamEndsLen = streamEndsSize = 0;
  
    str->reset();
    while (1) {
      pos = str->getPos();
-    if (!str->getLine(buf, 256))
+    if (!str->getLine(buf, 256)) {
        break;
+    }
      p = buf;
  
      // got trailer dictionary
      if (!strncmp(p, "trailer", 7)) {
        obj.initNull();
-      parser = new Parser(new Lexer(str->subStream(start + pos + 8, -1, &obj)));
+      parser = new Parser(NULL,
+                new Lexer(NULL,
+                  str->makeSubStream(start + pos + 7, gFalse, 0, &obj)));
        if (!trailerDict.isNone())
         trailerDict.free();
        parser->getObj(&trailerDict);
@@ -353,7 +413,7 @@ GBool XRef::constructXRef(Stream *str) {
                 entries = (XRefEntry *)
                             grealloc(entries, newSize * sizeof(XRefEntry));
                 for (i = size; i < newSize; ++i) {
-                 entries[i].offset = -1;
+                 entries[i].offset = 0xffffffff;
                   entries[i].used = gFalse;
                 }
                 size = newSize;
@@ -367,6 +427,14 @@ GBool XRef::constructXRef(Stream *str) {
           }
         }
        }
+
+    } else if (!strncmp(p, "endstream", 9)) {
+      if (streamEndsLen == streamEndsSize) {
+       streamEndsSize += 64;
+       streamEnds = (Guint *)grealloc(streamEnds,
+                                      streamEndsSize * sizeof(int));
+      }
+      streamEnds[streamEndsLen++] = pos;
      }
    }
  
@@ -377,26 +445,138 @@ GBool XRef::constructXRef(Stream *str) {
    return gFalse;
  }
  
-GBool XRef::checkEncrypted() {
+#ifndef NO_DECRYPTION
+GBool XRef::checkEncrypted(GString *ownerPassword, GString *userPassword) {
+  Object encrypt, filterObj, versionObj, revisionObj, lengthObj;
+  Object ownerKey, userKey, permissions, fileID, fileID1;
+  GBool encrypted1;
+  GBool ret;
+
+  ret = gFalse;
+
+  permFlags = defPermFlags;
+  ownerPasswordOk = gFalse;
+  trailerDict.dictLookup("Encrypt", &encrypt);
+  if ((encrypted1 = encrypt.isDict())) {
+    ret = gTrue;
+    encrypt.dictLookup("Filter", &filterObj);
+    if (filterObj.isName("Standard")) {
+      encrypt.dictLookup("V", &versionObj);
+      encrypt.dictLookup("R", &revisionObj);
+      encrypt.dictLookup("Length", &lengthObj);
+      encrypt.dictLookup("O", &ownerKey);
+      encrypt.dictLookup("U", &userKey);
+      encrypt.dictLookup("P", &permissions);
+      trailerDict.dictLookup("ID", &fileID);
+      if (versionObj.isInt() &&
+         revisionObj.isInt() &&
+         ownerKey.isString() && ownerKey.getString()->getLength() == 32 &&
+         userKey.isString() && userKey.getString()->getLength() == 32 &&
+         permissions.isInt() &&
+         fileID.isArray()) {
+       encVersion = versionObj.getInt();
+       encRevision = revisionObj.getInt();
+       if (lengthObj.isInt()) {
+         keyLength = lengthObj.getInt() / 8;
+       } else {
+         keyLength = 5;
+       }
+       permFlags = permissions.getInt();
+       if (encVersion >= 1 && encVersion <= 2 &&
+           encRevision >= 2 && encRevision <= 3) {
+         fileID.arrayGet(0, &fileID1);
+         if (fileID1.isString()) {
+           if (Decrypt::makeFileKey(encVersion, encRevision, keyLength,
+                                    ownerKey.getString(), userKey.getString(),
+                                    permFlags, fileID1.getString(),
+                                    ownerPassword, userPassword, fileKey,
+                                    &ownerPasswordOk)) {
+             if (ownerPassword && !ownerPasswordOk) {
+               error(-1, "Incorrect owner password");
+             }
+             ret = gFalse;
+           } else {
+             error(-1, "Incorrect password");
+           }
+         } else {
+           error(-1, "Weird encryption info");
+         }
+         fileID1.free();
+       } else {
+         error(-1, "Unsupported version/revision (%d/%d) of Standard security handler",
+               encVersion, encRevision);
+       }
+      } else {
+       error(-1, "Weird encryption info");
+      }
+      fileID.free();
+      permissions.free();
+      userKey.free();
+      ownerKey.free();
+      lengthObj.free();
+      revisionObj.free();
+      versionObj.free();
+    } else {
+      error(-1, "Unknown security handler '%s'",
+           filterObj.isName() ? filterObj.getName() : "???");
+    }
+    filterObj.free();
+  }
+  encrypt.free();
+
+  // this flag has to be set *after* we read the O/U/P strings
+  encrypted = encrypted1;
+
+  return ret;
+}
+#else
+GBool XRef::checkEncrypted(GString *ownerPassword, GString *userPassword) {
    Object obj;
    GBool encrypted;
  
    trailerDict.dictLookup("Encrypt", &obj);
    if ((encrypted = !obj.isNull())) {
-    error(-1, "PDF file is encrypted and cannot be displayed");
-    error(-1, "* Decryption support is currently not included in xpdf");
-    error(-1, "* due to legal restrictions: the U.S.A. still has bogus");
-    error(-1, "* export controls on cryptography software.");
+    error(-1, "PDF file is encrypted and this version of the Xpdf tools");
+    error(-1, "was built without decryption support.");
    }
    obj.free();
    return encrypted;
  }
+#endif
+
+GBool XRef::okToPrint(GBool ignoreOwnerPW) {
+#ifndef NO_DECRYPTION
+  if ((ignoreOwnerPW || !ownerPasswordOk) && !(permFlags & permPrint)) {
+    return gFalse;
+  }
+#endif
+  return gTrue;
+}
+
+GBool XRef::okToChange(GBool ignoreOwnerPW) {
+#ifndef NO_DECRYPTION
+  if ((ignoreOwnerPW || !ownerPasswordOk) && !(permFlags & permChange)) {
+    return gFalse;
+  }
+#endif
+  return gTrue;
+}
  
-GBool XRef::okToPrint() {
+GBool XRef::okToCopy(GBool ignoreOwnerPW) {
+#ifndef NO_DECRYPTION
+  if ((ignoreOwnerPW || !ownerPasswordOk) && !(permFlags & permCopy)) {
+    return gFalse;
+  }
+#endif
    return gTrue;
  }
  
-GBool XRef::okToCopy() {
+GBool XRef::okToAddNotes(GBool ignoreOwnerPW) {
+#ifndef NO_DECRYPTION
+  if ((ignoreOwnerPW || !ownerPasswordOk) && !(permFlags & permNotes)) {
+    return gFalse;
+  }
+#endif
    return gTrue;
  }
  
@@ -412,16 +592,23 @@ Object *XRef::fetch(int num, int gen, Object *obj) {
    }
  
    e = &entries[num];
-  if (e->gen == gen && e->offset >= 0) {
+  if (e->gen == gen && e->offset != 0xffffffff) {
      obj1.initNull();
-    parser = new Parser(new Lexer(str->subStream(start + e->offset, -1, &obj1)));
+    parser = new Parser(this,
+              new Lexer(this,
+                str->makeSubStream(start + e->offset, gFalse, 0, &obj1)));
      parser->getObj(&obj1);
      parser->getObj(&obj2);
      parser->getObj(&obj3);
      if (obj1.isInt() && obj1.getInt() == num &&
         obj2.isInt() && obj2.getInt() == gen &&
         obj3.isCmd("obj")) {
+#ifndef NO_DECRYPTION
+      parser->getObj(obj, encrypted ? fileKey : (Guchar *)NULL, keyLength,
+                    num, gen);
+#else
        parser->getObj(obj);
+#endif
      } else {
        obj->initNull();
      }
@@ -438,3 +625,43 @@ Object *XRef::fetch(int num, int gen, Object *obj) {
  Object *XRef::getDocInfo(Object *obj) {
    return trailerDict.dictLookup("Info", obj);
  }
+
+// Added for the pdftex project.
+Object *XRef::getDocInfoNF(Object *obj) {
+  return trailerDict.dictLookupNF("Info", obj);
+}
+
+GBool XRef::getStreamEnd(Guint streamStart, Guint *streamEnd) {
+  int a, b, m;
+
+  if (streamEndsLen == 0 ||
+      streamStart > streamEnds[streamEndsLen - 1]) {
+    return gFalse;
+  }
+
+  a = -1;
+  b = streamEndsLen - 1;
+  // invariant: streamEnds[a] < streamStart <= streamEnds[b]
+  while (b - a > 1) {
+    m = (a + b) / 2;
+    if (streamStart <= streamEnds[m]) {
+      b = m;
+    } else {
+      a = m;
+    }
+  }
+  *streamEnd = streamEnds[b];
+  return gTrue;
+}
+
+Guint XRef::strToUnsigned(char *s) {
+  Guint x;
+  char *p;
+  int i;
+
+  x = 0;
+  for (p = s, i = 0; *p && isdigit(*p) && i < 10; ++p, ++i) {
+    x = 10 * x + (*p - '0');
+  }
+  return x;
+}