Como Ler Metadados de Página do OneNote em Python
Os arquivos OneNote .one armazenam metadados que você pode ler sem analisar o DOM completo do documento. No nível documento, Document.FileFormat informa qual variante do OneNote o arquivo usa. No nível página, cada Page contém o autor, o carimbo de data/hora de criação, o carimbo de data/hora da última modificação e o nível de hierarquia. O Aspose.Note FOSS for Python expõe esses através das classes Document e Page.
Pré-requisitos
pip install aspose-noteMetadados de Nível de Documento
O objeto Document expõe uma propriedade de metadados:
| Propriedade | Tipo | Descrição |
|---|---|---|
doc.FileFormat | FileFormat | A variante do OneNote: FileFormat.OneNote2010, FileFormat.OneNoteOnline ou FileFormat.Unknown. |
from aspose.note import Document
doc = Document("MyNotes.one")
print(f"File format: {doc.FileFormat}")Metadados de Nível de Página
Cada objeto Page contém:
| Property | Type | Description |
|---|---|---|
page.Author | str | None | O nome de exibição do usuário que criou ou possui a página. |
page.CreationTime | datetime | None | Quando a página foi criada. Retorna um objeto Python datetime em UTC. |
page.LastModifiedTime | datetime | None | Quando a página foi modificada pela última vez. |
page.Level | int | None | Nível de recuo da subpágina. 0 = página de nível superior, 1 = subpágina de primeiro nível, 2 = segundo nível, etc. |
Etapa 1: Ler Metadados de Cada Página
from aspose.note import Document, Page
doc = Document("ProjectNotes.one")
for i, page in enumerate(doc, start=1):
title = ""
if page.Title and page.Title.TitleText:
title = page.Title.TitleText.Text.strip()
level = page.Level or 0
indent = " " * level
author = page.Author or "(unknown)"
created = page.CreationTime.strftime("%Y-%m-%d") if page.CreationTime else "(none)"
modified = page.LastModifiedTime.strftime("%Y-%m-%d %H:%M") if page.LastModifiedTime else "(none)"
print(f"{indent}[{i}] {title or '(untitled)'}")
print(f"{indent} Author: {author}")
print(f"{indent} Created: {created}")
print(f"{indent} Modified: {modified}")
print(f"{indent} Level: {level}")Exemplo Completo: Relatório de Metadados
from aspose.note import Document
def print_metadata_report(one_path: str) -> None:
doc = Document(one_path)
print()
for i, page in enumerate(doc, start=1):
title = ""
if page.Title and page.Title.TitleText:
title = page.Title.TitleText.Text.strip()
level = page.Level or 0
prefix = " " * level + f"[{i}]"
parts = [prefix, f'"{title or "(untitled)"}"']
if page.Author:
parts.append(f"by {page.Author}")
if page.CreationTime:
parts.append(f"created {page.CreationTime.strftime('%Y-%m-%d')}")
if page.LastModifiedTime:
parts.append(f"modified {page.LastModifiedTime.strftime('%Y-%m-%d')}")
print(" ".join(parts))
print_metadata_report("ProjectNotes.one")Detectando Subpáginas
No OneNote, as subpáginas são visualmente recuadas sob sua página pai. A propriedade page.Level reflete esse aninhamento:
from aspose.note import Document
doc = Document("MyNotes.one")
for page in doc:
level = page.Level or 0
title = ""
if page.Title and page.Title.TitleText:
title = page.Title.TitleText.Text.strip()
indent = " " * level
marker = "├─" if level > 0 else "•"
print(f"{indent}{marker} {title or '(untitled)'}")Valores de nível:
0: página de nível superior1: subpágina de primeiro nível (uma indentação)2: subpágina de segundo nível (duas indentações)
Notas
- Todos os timestamps (
CreationTime,LastModifiedTime) são objetosdatetimeem UTC quando presentes. page.LevelretornaNonepara páginas onde o nível não foi armazenado no formato binário. TrateNonecomo0usandopage.Level or 0.