get_diversity_samples#

plinder.core.loader.get_diversity_samples(split_df: pd.DataFrame, split: Literal['train', 'val', 'test'] = 'train', cluster_tag: None | str = None, metric: Literal['pli_qcov', 'pli_unique_qcov', 'pocket_fident', 'pocket_fident_qcov', 'pocket_lddt', 'pocket_lddt_qcov', 'pocket_qcov', 'protein_fident_max', 'protein_fident_qcov_max', 'protein_fident_qcov_weighted_max', 'protein_fident_qcov_weighted_sum', 'protein_fident_weighted_max', 'protein_fident_weighted_sum', 'protein_lddt_max', 'protein_lddt_qcov_max', 'protein_lddt_qcov_weighted_max', 'protein_lddt_qcov_weighted_sum', 'protein_lddt_weighted_max', 'protein_lddt_weighted_sum', 'protein_qcov_weighted_sum', 'protein_seqsim_max', 'protein_seqsim_qcov_max', 'protein_seqsim_qcov_weighted_max', 'protein_seqsim_qcov_weighted_sum', 'protein_seqsim_weighted_max', 'protein_seqsim_weighted_sum'] = 'pli_qcov', directed: bool = True, threshold: int = 100, cluster_type: Literal['component', 'communities'] = 'component') pd.DataFrame[source]#