Как считать метаданные изображения из OneNote на Python
Каждый Image узел в документе OneNote содержит метаданные вместе с необработанными байтами пикселей: оригинальное имя файла, размеры отображения (ширина и высота в пунктах), альтернативный текст для доступности и, при необходимости, URL гиперссылки, если изображение было связано. Aspose.Note FOSS for Python раскрывает все эти поля через класс Image.
Требования
pip install aspose-noteСвойства изображения
| Property | Type | Description |
|---|---|---|
img.Bytes | bytes | Необработанные данные изображения. Записать на диск с помощью open(name, "wb").write(img.Bytes). |
img.FileName | str | None | Исходное имя файла, сохранённое в файле .one. None, если не сохранено. |
img.Width | float | None | Ширина отображения в пунктах. None, если не сохранено. |
img.Height | float | None | Высота отображения в пунктах. None, если не сохранено. |
img.AlternativeTextDescription | str | None | Текст альтернативного описания для доступности. None, если не установлен. |
img.AlternativeTextTitle | str | None | Заголовок альтернативного текста для доступности. None, если не установлен. |
img.HyperlinkUrl | str | None | URL, если изображение является кликабельной гиперссылкой. None, если ссылка отсутствует. |
img.Tags | list[NoteTag] | Теги OneNote, прикреплённые к этому изображению (звёздочка, флажок и т.д.). |
Шаг 1: Загрузить документ и найти изображения
from aspose.note import Document, Image
doc = Document("MyNotes.one")
images = doc.GetChildNodes(Image)
print(f"Found {len(images)} image(s)")Шаг 2: Чтение метаданных для каждого изображения
Защищайте все nullable‑поля с помощью is not None перед использованием:
from aspose.note import Document, Image
doc = Document("MyNotes.one")
for i, img in enumerate(doc.GetChildNodes(Image), start=1):
print(f"\nImage {i}:")
print(f" Filename: {img.FileName or '(no filename)'}")
print(f" Size: {img.Bytes and len(img.Bytes):,} bytes")
if img.Width is not None and img.Height is not None:
print(f" Dimensions: {img.Width:.1f} × {img.Height:.1f} pts")
if img.AlternativeTextDescription:
print(f" Alt text: {img.AlternativeTextDescription}")
if img.HyperlinkUrl:
print(f" Hyperlink: {img.HyperlinkUrl}")
if img.Tags:
for tag in img.Tags:
print(f" Tag: {tag.Label or tag.Icon}")Полный пример: Сохранить изображения с отчетом о метаданных
from pathlib import Path
from aspose.note import Document, Image
def report_and_save_images(one_path: str, out_dir: str = "images") -> None:
doc = Document(one_path)
images = doc.GetChildNodes(Image)
if not images:
print("No images found.")
return
out = Path(out_dir)
out.mkdir(exist_ok=True)
for i, img in enumerate(images, start=1):
# Determine save name
name = img.FileName or f"image_{i}.bin"
dest = out / name
# Save bytes
dest.write_bytes(img.Bytes)
# Report metadata
dims = (
f"{img.Width:.0f}×{img.Height:.0f}pts"
if img.Width is not None and img.Height is not None
else "unknown size"
)
alt = img.AlternativeTextDescription or ""
link = img.HyperlinkUrl or ""
print(f" [{i}] {name} {dims}"
+ (f" alt='{alt}'" if alt else "")
+ (f" url={link}" if link else ""))
print(f"\nSaved {len(images)} image(s) to '{out_dir}/'")
report_and_save_images("MyNotes.one")Фильтрация изображений по свойству
Изображения со ссылками
from aspose.note import Document, Image
doc = Document("MyNotes.one")
linked = [img for img in doc.GetChildNodes(Image) if img.HyperlinkUrl]
for img in linked:
print(f"{img.FileName or 'image'} → {img.HyperlinkUrl}")Изображения с альтернативным текстом
from aspose.note import Document, Image
doc = Document("MyNotes.one")
with_alt = [img for img in doc.GetChildNodes(Image) if img.AlternativeTextDescription]
for img in with_alt:
print(f"{img.FileName}: {img.AlternativeTextDescription}")Примечания
img.Bytesвсегда присутствует (возвращаетb""для нечитаемых изображений, никогдаNone). Проверьтеlen(img.Bytes) > 0перед сохранением.img.AlternativeTextTitleможет бытьNone, если исходный документ не задает заголовок. Используйтеimg.AlternativeTextDescriptionв качестве резервного варианта.- Размеры указаны в points (1 point = 1/72 дюйма), соответствуют конвенциям PowerPoint и PDF.