QueryDataset

class lightning_ir.data.dataset.QueryDataset(query_dataset: str, num_queries: int | None = None)[source]

Bases: IRDataset, _DataParallelIterableDataset

__init__(query_dataset: str, num_queries: int | None = None) → None[source]

Dataset containing queries.

Parameters:

query_dataset (str) – Path to file containing queries or valid ir_datasets id.
num_queries (int | None, optional) – Number of queries in dataset. If None, the number of queries will attempted to be inferred. Defaults to None.

Methods

`__init__`(query_dataset[, num_queries])	Dataset containing queries.
`prepare_data`()	Downloads queries using ir_datasets if needed.

Attributes

prepare_data() → None[source]: Downloads queries using ir_datasets if needed.